الاء عماد 2024-12-23 2 دقائق قراءة

نماذج O3 و O3-Mini أحدث جهود OpenAI في الاستدلال والسلامة

حجم النص

في اليوم الأخير من حدث (ship-mas)، استعرضت شركة OpenAI مجموعة جديدة من نماذج “الاستدلال” المتطورة أطلقت عليها اسم نماذج o3 و o3-mini.

نماذج o3 و o3-mini

قدرات فائقة لنماذج o3 و o3-mini من شركة OpenAI

لا تُطلق الشركة هذه النماذج اليوم (وتعترف بأن النتائج النهائية قد تتطور مع مزيد من التدريب بعد الإصدار)، ومع ذلك، فإن شركة OpenAI تقبل طلبات من مجتمع البحث لاختبار هذه الأنظمة قبل الإصدار العام (الذي لم تحدد موعدًا له بعد)، أطلقت OpenAI نموذج o1 (المعروف باسم Strawberry) في سبتمبر وتتخطى الآن o2 مباشرة إلى o3، متجنبةً الالتباس (أو تعارض العلامات التجارية) مع شركة الاتصالات البريطانية O2.

ما هو “الاستدلال” “reasoning” في سياق الذكاء الاصطناعي؟

أصبح مصطلح “الاستدلال” كلمة طنانة شائعة في صناعة الذكاء الاصطناعي مؤخرًا، لكنه يعني بشكل أساسي أن الآلة تقسم التعليمات إلى مهام أصغر يمكن أن تنتج نتائج أقوى، تُظهر هذه النماذج غالبًا خطوات عملها للوصول إلى إجابة، بدلاً من مجرد إعطاء إجابة نهائية دون تفسير.

لاتفوت: كيفية استبدال محرك بحث جوجل بـ ChatGPT Search في متصفحك بخطوات بسيطة

إنجازات استثنائية لنماذج o3 و o3-mini في الاختبارات

وفقًا للشركة، تتفوق نماذج o3 و o3-mini على سجلات الأداء السابقة في جميع المجالات، حيث تفوق على سابقه في اختبارات البرمجة (المسماة SWE-Bench Verified) بنسبة 22.8 في المائة ويتفوق على كبير علماء OpenAI في البرمجة التنافسية. لقد اجتاز النموذج تقريبًا واحدة من أصعب مسابقات الرياضيات (المسماة AIME 2024)، وفشل في سؤال واحد فقط، وحقق 87.7 في المائة في معيار لمشكلات العلوم على مستوى الخبراء (المسمى GPQA Diamond).

نماذج o3 و o3-mini

في أصعب تحديات الرياضيات والاستدلال التي عادة ما تُربك الذكاء الاصطناعي، حلت نماذج o3 و o3-mini 25.2 في المائة من المشكلات (حيث لا يتجاوز أي نموذج آخر 2 في المائة).

تقنية “المحاذاة التداولية” “deliberative alignment” لتعزيز أمان الذكاء الاصطناعي

أعلنت الشركة أيضًا عن بحث جديد حول “المحاذاة التداولية” “deliberative alignment“، والتي تتطلب من نموذج الذكاء الاصطناعي معالجة قرارات السلامة خطوة بخطوة، لذلك، بدلاً من مجرد إعطاء قواعد نعم / لا لنموذج الذكاء الاصطناعي، تتطلب هذه الطريقة منه أن يستدل بشكل فعال حول ما إذا كان طلب المستخدم يناسب سياسات الأمان الخاصة بشركة OpenAI، تدعي الشركة أنه عند اختبار هذا على o1، كان أفضل بكثير في اتباع إرشادات السلامة من النماذج السابقة، بما في ذلك GPT-4.

قد يهمك ايضًا: تواصل مع ChatGPT عبر الهاتف أو واتساب تجربة جديدة من OpenAI

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *