في اليوم الأخير من حدث (ship-mas)، استعرضت شركة OpenAI مجموعة جديدة من نماذج “الاستدلال” المتطورة أطلقت عليها اسم نماذج o3 و o3-mini.
قدرات فائقة لنماذج o3 و o3-mini من شركة OpenAI
لا تُطلق الشركة هذه النماذج اليوم (وتعترف بأن النتائج النهائية قد تتطور مع مزيد من التدريب بعد الإصدار)، ومع ذلك، فإن شركة OpenAI تقبل طلبات من مجتمع البحث لاختبار هذه الأنظمة قبل الإصدار العام (الذي لم تحدد موعدًا له بعد)، أطلقت OpenAI نموذج o1 (المعروف باسم Strawberry) في سبتمبر وتتخطى الآن o2 مباشرة إلى o3، متجنبةً الالتباس (أو تعارض العلامات التجارية) مع شركة الاتصالات البريطانية O2.
ما هو “الاستدلال” “reasoning” في سياق الذكاء الاصطناعي؟
أصبح مصطلح “الاستدلال” كلمة طنانة شائعة في صناعة الذكاء الاصطناعي مؤخرًا، لكنه يعني بشكل أساسي أن الآلة تقسم التعليمات إلى مهام أصغر يمكن أن تنتج نتائج أقوى، تُظهر هذه النماذج غالبًا خطوات عملها للوصول إلى إجابة، بدلاً من مجرد إعطاء إجابة نهائية دون تفسير.
لاتفوت: كيفية استبدال محرك بحث جوجل بـ ChatGPT Search في متصفحك بخطوات بسيطة
إنجازات استثنائية لنماذج o3 و o3-mini في الاختبارات
وفقًا للشركة، تتفوق نماذج o3 و o3-mini على سجلات الأداء السابقة في جميع المجالات، حيث تفوق على سابقه في اختبارات البرمجة (المسماة SWE-Bench Verified) بنسبة 22.8 في المائة ويتفوق على كبير علماء OpenAI في البرمجة التنافسية. لقد اجتاز النموذج تقريبًا واحدة من أصعب مسابقات الرياضيات (المسماة AIME 2024)، وفشل في سؤال واحد فقط، وحقق 87.7 في المائة في معيار لمشكلات العلوم على مستوى الخبراء (المسمى GPQA Diamond).
في أصعب تحديات الرياضيات والاستدلال التي عادة ما تُربك الذكاء الاصطناعي، حلت نماذج o3 و o3-mini 25.2 في المائة من المشكلات (حيث لا يتجاوز أي نموذج آخر 2 في المائة).
تقنية “المحاذاة التداولية” “deliberative alignment” لتعزيز أمان الذكاء الاصطناعي
أعلنت الشركة أيضًا عن بحث جديد حول “المحاذاة التداولية” “deliberative alignment“، والتي تتطلب من نموذج الذكاء الاصطناعي معالجة قرارات السلامة خطوة بخطوة، لذلك، بدلاً من مجرد إعطاء قواعد نعم / لا لنموذج الذكاء الاصطناعي، تتطلب هذه الطريقة منه أن يستدل بشكل فعال حول ما إذا كان طلب المستخدم يناسب سياسات الأمان الخاصة بشركة OpenAI، تدعي الشركة أنه عند اختبار هذا على o1، كان أفضل بكثير في اتباع إرشادات السلامة من النماذج السابقة، بما في ذلك GPT-4.
قد يهمك ايضًا: تواصل مع ChatGPT عبر الهاتف أو واتساب تجربة جديدة من OpenAI