طور باحثون من معهد موسكو للفيزياء والتكنولوجيا بالتعاون مع شركاء دوليين نظام رؤية ثلاثية متقدم يُعرف باسم Un-ViTAStereo، يتيح للروبوتات والمركبات الذاتية تقدير المسافات بدقة باستخدام الكاميرات فقط، دون الحاجة إلى أجهزة استشعار إضافية باهظة التكلفة.
العمل بكفاءة في الظروف الصعبة
تتميّز التقنية الجديدة بقدرتها على العمل بشكل مستقر في البيئات المعقدة، مثل:
الضباب الكثيف
المناطق ذات الغطاء النباتي الكثيف
الأسطح المتشابهة أو عديمة التفاصيل
وهي ظروف عادةً ما تواجه فيها الأنظمة التقليدية صعوبة في تحديد المسافات بدقة.
بديل اقتصادي لأجهزة الاستشعار المكلفة
تعتمد العديد من الأنظمة الحالية على أجهزة مثل "ليدار" لقياس المسافات، وهي تقنيات دقيقة لكنها مكلفة. أما النظام الجديد فيقدم بديلاً اقتصاديا من خلال:
الاعتماد على كاميرات فقط
تقليل الحاجة إلى أجهزة إضافية
خفض تكاليف تطوير الأنظمة الذاتية
ومع ذلك، لا يزال يتطلب كميات كبيرة من البيانات لتدريب النماذج الذكية.
كيف تعمل التقنية؟
تعتمد الفكرة على محاكاة طريقة رؤية الإنسان للعالم ثلاثي الأبعاد، حيث:
تستخدم الكاميرات بدلا من العينين
تعتمد الخوارزميات بدلا من الدماغ
ولتحسين الدقة، استخدم الباحثون نموذجا مساعدا يُعرف باسم Depth Anything V2، والذي:
يحدد العلاقات النسبية بين الأجسام (أقرب/أبعد)
يحلل الظلال والمنظور والتداخل بين العناصر
ثم يتم تدريب النظام على اختيار النتائج الأكثر دقة بناءً على هذه "الإرشادات الذكية".
تحسين دقة التقدير وتقليل الأخطاء
أظهرت الاختبارات على قاعدة بيانات KITTI 2015 الخاصة بالمركبات الذاتية:
انخفاض الأخطاء الكبيرة إلى نحو 5%
تقليل الأخطاء الخطرة في تقدير المسافات بنسبة تصل إلى 23%
وهذا يعزز سلامة الأنظمة، خاصة في البيئات الحضرية.
تطبيقات واسعة في المستقبل
يمكن استخدام هذه التقنية في مجموعة واسعة من المجالات، منها:
السيارات ذاتية القيادة
روبوتات التوصيل
الطائرات بدون طيار
الروبوتات الصناعية داخل المصانع
أنظمة المراقبة والأمن
كما يخطط الباحثون لتطوير نسخة ذاتية التعلم قادرة على التكيف مع بيئات مختلفة.
نحو رؤية أقرب للبشر
يرى خبراء أن هذه التقنية تقرّب إدراك الآلة من الإدراك البشري، حيث لا تعتمد فقط على قياس المسافات بالأرقام، بل تفهم العلاقات بين الأجسام وحدودها، حتى في الظروف التي يصعب فيها الرؤية.
تحديات وحدود التقنية
رغم مزاياها، لا تزال هناك بعض التحديات:
الحاجة إلى بيانات تدريب واسعة ومتنوعة
الاعتماد الجزئي على مصادر دقيقة مثل الليدار لتحسين الأداء
تأثر النتائج بجودة البيانات المستخدمة
يمثل نظام Un-ViTAStereo خطوة مهمة نحو تطوير أنظمة رؤية ذكية أكثر كفاءة وأقل تكلفة، مما قد يسرّع انتشار الروبوتات والمركبات الذاتية في الحياة اليومية، خاصة في البيئات الصعبة.