نموذج جديد من OpenAI يحقق 83% في اختبار المعرفة الاحترافية

6 آذار 2026 , 14:45 م

تطبيقات.

التنقل داخل البرامج.

تنفيذ مهام متعددة عبر أنظمة مختلفة.

وتتيح هذه الميزة لوكلاء الذكاء الاصطناعي تخطيط وتنفيذ ومراجعة المهام الطويلة والمعقدة مع الحفاظ على السياق الكامل للعملية.

تحسينات في السلامة والشفافية

قدمت الشركة أيضا نظام تقييم جديد يركز على تحليل الاستدلال خطوة بخطوة، وهو ما يعرف بسلسلة التفكير (Chain-of-Thought).

ويخشى بعض الباحثين في مجال سلامة الذكاء الاصطناعي من أن تتمكن النماذج المتقدمة من إخفاء طريقة تفكيرها الحقيقية أثناء حل المشكلات المعقدة.

لكن الاختبارات التي أجرتها OpenAI تشير إلى أن خطر هذا السلوك أقل في نسخة GPT-5.4 Thinking، مما يعني أن مراقبة سلسلة التفكير ما زالت أداة فعالة لضمان السلامة.