في خطوة تعزز مكانتها كعملاق تكنولوجي عالمي أعلنت شركة علي بابا الصينية عن دخولها المنافسة الشرسة في مجال الذكاء الاصطناعي عبر إطلاقها سلسلة نماذج Qwen2.5-VL التي تُعد نقلة نوعية في قدرات تحليل النصوص والصور والفيديو بل والتحكم في الأجهزة الحاسوبية، فما الذي يميز هذه النماذج وكيف تنافس عمالقة مثل OpenAI وGoogle؟
وفقًا لاختبارات أجراها فريق Qwen التابع لشركة علي بابا، تفوّق النموذج الرائد Qwen2.5-VL-72B على نماذج مثل GPT-4o من OpenAI وClaude 3.5 Sonnet من أنثروبيك وGemini 2.0 من جوجل في مهام فهم الفيديو والعمليات الحسابية وتحليل المستندات، هذه النتائج تُبرز التقدم التقني الذي حققته علي بابا خاصة في تحليل المحتوى المرئي والمعقد كالرسوم البيانية والفواتير الممسوحة ضوئيًا.
الميزات الرائعة للنموذج الجديد
لا تقتصر قدرات Qwen2.5-VL على المعالجة اللغوية فحسب، بل تمتد إلى:
- استخراج البيانات من الجداول والفواتير بدقة عالية.
- فهم مقاطع الفيديو الطويلة وتحديد الشخصيات والأعمال الفنية فيها، ما يفتح آفاقًا جديدة في تحليل المحتوى المرئي.
- التحكم في التطبيقات والأجهزة، كما ظهر في تجربة استخدام النموذج لحجز رحلات عبر تطبيق Booking، محاكيًا قدرات وكيل الذكاء الاصطناعي Operator من OpenAI.
لكن رغم هذه الإمكانيات كشفت اختبارات OSWorld عن تحديات تواجه النموذج في البيئات الحاسوبية المعقدة ما يطرح فرصًا للتطوير المستقبلي.
موعد توافر النموذج الجديد من علي بابا
أتاحت شركة علي بابا النماذج الأصغر حجمًا (مثل Qwen2.5-VL-3B وQwen2.5-VL-7B) عبر منصتي Qwen Chat وHugging Face بترخيص مفتوح، بينما خضع النموذج الأقوى Qwen2.5-VL-72B لترخيص خاص يفرض قيودًا على الشركات الكبرى ذات الـ100 مليون مستخدم شهريًا، هذا النهج يُظهر إستراتيجية علي بابا في موازنة الابتكار مع حماية مصالحها التجارية.
هل يمكن للنموذج المنافسة ؟
بإطلاق Qwen2.5-VL تؤكد علي بابا التزامها بتقديم حلول ذكاء اصطناعي متعددة الاستخدامات، تنافس بها كبرى الشركات العالمية بل وتتفوق في مجالات محددة، هذا الإنجاز يضعها على الخريطة بجانب شركات صينية ناشئة مثل DeepSeek ويُظهر تصميمها على لعب دور محوري في مستقبل التكنولوجيا.
في النهاية فإن سوق الذكاء الصناعي عبارة عن سباق لا مكان للتراجع فيه، بدخول علي بابا معترك الذكاء الاصطناعي بقوة، يصبح المشهد التكنولوجي أكثر إثابة وتحديًا، مع Qwen2.5-VL لم تعد المنافسة محصورة في الغرب، بل امتدت إلى آسيا بقوة دفع هائلة، يمكن للمطورين والمهتمين تجربة النماذج الآن، بينما تترقب الأسواق الإصدارات القادمة التي قد تعيد تعريف التفاعل بين الإنسان والآلة.
قد يهمك: مميزات Gemini 2.0 الجديد من جوجل