تطبيقات.
التنقل داخل البرامج.
تنفيذ مهام متعددة عبر أنظمة مختلفة.
وتتيح هذه الميزة لوكلاء الذكاء الاصطناعي تخطيط وتنفيذ ومراجعة المهام الطويلة والمعقدة مع الحفاظ على السياق الكامل للعملية.
تحسينات في السلامة والشفافية
قدمت الشركة أيضا نظام تقييم جديد يركز على تحليل الاستدلال خطوة بخطوة، وهو ما يعرف بسلسلة التفكير (Chain-of-Thought).
ويخشى بعض الباحثين في مجال سلامة الذكاء الاصطناعي من أن تتمكن النماذج المتقدمة من إخفاء طريقة تفكيرها الحقيقية أثناء حل المشكلات المعقدة.
لكن الاختبارات التي أجرتها OpenAI تشير إلى أن خطر هذا السلوك أقل في نسخة GPT-5.4 Thinking، مما يعني أن مراقبة سلسلة التفكير ما زالت أداة فعالة لضمان السلامة.
تحسين الدقة وتقليل الأخطاء
أظهرت الاختبارات أيضا تحسنا ملحوظا في دقة المعلومات.
فقد كان GPT‑5.4:
أقل عرضة بنسبة 33% لإنتاج ادعاءات خاطئة مقارنة بنموذج GPT‑5.2.
أقل بنسبة 18% في تضمين أخطاء واقعية ضمن الإجابات.
وفي ChatGPT يمكن لنسخة Thinking عرض خطة استدلال أولية قبل توليد الإجابة الكاملة، ما يسمح للمستخدم بتعديل