هل عادت OpenAI بGPT-5.2 لتقلب الموازين؟
في خطوة مفاجئة، أعلنت أوبن أي عن إصدار GPT-5.2، ليبدأ فصل جديد في سباق الذكاء الاصطناعي مع جوجل وAnthropic. الفيديو الذي قدمه أحد المراجعين العرب تناول النموذج الجديد بشكل مفصل، واختبره ميدانياً في البرمجة والاختبارات الرياضية، فهل فعلاً يستحق كل هذا الضجيج؟
تفوق أولي في الأرقام والاختبارات
بحسب ما جاء في الفيديو (00:44)، حصل GPT-5.2 على نتائج مذهلة في اختبارات SWE-Bench Pro، متفوقاً على جيميني 3 برو بنسبة 12%، بل وحقق العلامة الكاملة في اختبار الرياضيات التنافسية AIME 2025.
لكن المراجع عبّر عن شكه في هذه النتائج، خصوصاً عندما تتعارض مع أداء النماذج المنافسة مثل Claude 4.5.
اختبار عملي: برمجة لعبة ثلاثية الأبعاد
في تجربة ميدانية (01:19)، تم اختبار النموذج بإنشاء لعبة متصفح ثلاثية الأبعاد باستخدام Three.js، تتضمن فيزياء واقعية وتوليد بيئات عشوائية.
النتيجة؟ GPT-5.2 نجح في بناء اللعبة من الصفر خلال خمس دقائق فقط، لكنه فشل في تشغيل بعض العناصر مثل إطلاق النار وحركة الكائنات بشكل دقيق.
تجربة نموذج “Think” من GPT-5.2 أعطت نتائج أفضل بصرياً، لكنها بقيت مليئة بالأخطاء البرمجية (03:38).
النتائج الرسمية تقول شيئاً آخر
عند العودة إلى موقع SWE-Bench الرسمي (04:07)، تبيّن أن Claude 4.5 يحتل المرتبة الأولى بنسبة 74.4%، يليه Gemini 3 Pro بـ74.2%، فيما جاء GPT-5.2 ثالثاً بـ71.8%.
وهذا يتفق تماماً مع نتائج الاختبار العملي، حيث تفوق كلود في الجمال والدقة، بينما قدّم جيميني نتائج متقاربة، وتراجع GPT-5.2 قليلاً رغم تحسنه الواضح عن الإصدارات السابقة.
قفزة نوعية... لكن ليست حاسمة
من الناحية النظرية، يحقق GPT-5.2 إنجازات مثيرة:
-
تكلفة تشغيل أقل بـ390 مرة من النماذج السابقة (02:31).
-
أداء قوي في الذكاء السائل وحل المسائل الجديدة.
-
تفوق واضح في خدمة العملاء المؤتمتة بنسبة 98.7% (06:19).
لكن في المقابل، جوجل ما زالت متفوقة في المسائل الرياضية المعقدة (05:45)، وتحتفظ بصدارتها في مجالات البحث وهندسة البرمجيات الدقيقة.
الخلاصة: عودة قوية، ولكن الحرب لم تُحسم بعد
يبدو أن GPT-5.2 هو خطوة عملاقة لأوبن أي نحو استعادة التوازن أمام جوجل، لكنه ليس “القاضية” التي تنهي السباق.
الاختبارات تشير إلى تفوقه في المنطق، البرمجة، والتكلفة، بينما تحتفظ جوجل بتفوقها في الرياضيات العميقة.
المراجِع يختم الفيديو قائلاً إن المنافسة الآن على أشدها، والنتائج القادمة من DeepSeek وxAI قد تغير الموازين مجدداً.
