استخدمت شركة ميتا الإنجيل في تدريب الذكاء الاصطناعي لتُصبح قادرةً على التحدث بأكثر من 1000 لغة حيث تأمل الشركة أن يُساعد ذلك بالحفاظ على اللغات المهددة بالزوال -مع الإشارة إلى وجود نحو 7000 لغة في العالم اليوم- بواسطة خوارزميات التعلم الجديد.
الذكاء الاصطناعي يتحدث بآلاف اللغات
جعلت الشركة نماذج اللغة المبنية على الذكاء الاصطناعي مُتاحةً للعامة، بواسطة أكواد البرمجة التي تُوضع على موقع الاستضافة الشهير غيت هب (Github)، الأمر الذي سيساعد المطورين على بناء تطبيقات تحدُّث متنوعة في لغات مختلفة وجديدة.
الإنجيل يعلم الذكاء الاصطناعي
خضعت نماذج اللغة المبنية على الذكاء الاصطناعي إلى التدريب على مجموعتين مختلفتين من البيانات، الأولى تحتوي على تسجيلات صوتية مقروءة من إنجيل العهد الجديد بـ 1107 لغات، وتحتوي المجموعة الثانية على مجموعة تسجيلات صوتية ليس لها تسمية بـ 3809 لغات.
أهمية المشروع الجديد
يقول عالم الأبحاث مايكل أولي في شركة ميتا الذي يعمل بهذا المشروع: «تسمح لنا قدرات تعلم نماذج اللغة من الإنجيل ببناء أنظمة تحدّث جديدة بسرعة، دون الحاجة إلى كم هائل من البيانات. لدينا العديد من مجموعات البيانات في اللغة الإنجليزية، ولدينا القليل أيضًا في لغات أخرى، لكن ما يزال ينقصنا بيانات للغات أخرى لا يتحدثها سوى 1000 شخص».
يدّعي الباحثون الآن أن هذه النماذج المبنية على الذكاء الاصطناعي قادرة على التحدث بما يزيد عن 1000 لغة، ولديها القدرة على التعرف إلى أكثر من 4000 لغة.
بعد المقارنة مع نماذج أخرى مثل Whisper الذي طورته شركة OpenAI المنافسة، فإن معدل ارتكاب الأخطاء في نموذج ميتا نصف ما هو عليه في النماذج الأخرى، مع أنه يُغطي 11 ضعفًا من اللغات أيضًا.
صوابية الذكاء الاصطناعي
لم تكن كل النتائج إيجابية، إذ يقول الباحثون إن النماذج الجديدة المبنية على الذكاء الاصطناعي قد تُخطئ في تحويل بعض الكلمات صوتيًا أو العبارات، إضافةً إلى إبداء نماذج التعرف على الحديث تحيزًا لكلمات معينة على حساب الأخرى مقارنةً مع نماذج أخرى، لكن بنسبة لا تتجاوز 0.7%.
يقول الباحث في Masakhane -منظمة تعمل على تقنيات معالجة اللغة للغات الأفريقية- كريس إميزو الذي لم يُشارك في المشروع أن استخدام النصوص الدينية لتدريب نماذج اللغة قد يتسبب بعدة مشكلات .