ChatGPT يزيل اللغات غير الإنجليزية من ثورة الذكاء الاصطناعي
في مربع حوار منفصل ، عند الاستعلام باللغة الإنجليزية ، حددت دردشة Bing بشكل صحيح تايلاند كموقع مشاع للإعداد التالي من العرض التلفزيوني اللوتس الابيض، لكنها قدمت “في مكان ما في آسيا” عندما تمت ترجمة طلب البحث إلى الإسبانية ، حسب قول سوليس ، الذي يدير شركة استشارية تسمى Orainti تساعد مواقع الويب على زيادة الزيارات من محركات البحث.
قال المسؤولون التنفيذيون في Microsoft و OpenAI و Google الذين يعملون على روبوتات الدردشة إن المستخدمين يمكنهم مواجهة الردود الضعيفة عن طريق إضافة إرشادات أكثر تفصيلاً إلى استفساراتهم. بدون توجيه صريح ، يمكن أن يكون تحيز روبوتات المحادثة للتراجع عن الحديث باللغة الإنجليزية ووجهات النظر الناطقة باللغة الإنجليزية قويًا. فقط اسأل Veruska Anconitano ، وهي خبيرة أخرى في تحسين محركات البحث ، تقسم وقتها بين إيطاليا وأيرلندا. وجدت أن طرح أسئلة دردشة على Bing باللغة الإيطالية أدى إلى الحصول على إجابات باللغة الإنجليزية ما لم تحدد “أجبني بالإيطالية”. تقول أنكونيتانو ، في محادثة مختلفة ، افترضت بينغ أنها تريد تحويل الموجه الياباني 元 気 で す か (“كيف حالك؟”) إلى اللغة الإنجليزية بدلاً من مواصلة المحادثة باللغة اليابانية.
أثبتت الأوراق البحثية الحديثة صحة النتائج القصصية للأشخاص الذين دخلوا حدود دردشة Bing وإخوانها. يقول Zheng-Xin Yong ، وهو طالب دكتوراه في جامعة براون يدرس أيضًا نماذج لغات متعددة ، إنه وجد ومعاونيه في إحدى الدراسات أن الحصول على إجابات أفضل للأسئلة الصينية يتطلب طرحها باللغة الإنجليزية ، بدلاً من الصينية.
عندما حاولت فونغ من هونج كونج ومعاونوها مطالبة ChatGPT بترجمة 30 جملة ، فقد نقلت 28 جملة بشكل صحيح من الإندونيسية إلى الإنجليزية ، ولكن 19 فقط في الاتجاه الآخر ، مما يشير إلى أن الأمريكيين أحادي اللغة الذين يلجأون إلى الروبوت لعقد صفقات مع التجار الإندونيسيين سيواجهون صعوبة . تم العثور على نفس الطلاقة المحدودة أحادية الاتجاه لتكرار ما لا يقل عن خمس لغات أخرى.
تجعل المشكلات اللغوية للنماذج اللغوية الكبيرة من الصعب الوثوق بها لأي شخص يغامر بتجاوز اللغة الإنجليزية ، وربما الصينية. عندما سعيت إلى ترجمة الترانيم السنسكريتية القديمة من خلال ChatGPT كجزء من تجربة في استخدام الذكاء الاصطناعي لتسريع التخطيط لحفل الزفاف ، بدت النتائج معقولة بما يكفي لإضافتها إلى نص الاحتفال. لكن لم يكن لدي أي فكرة عما إذا كان بإمكاني الاعتماد عليهم أم أن كبار السن سوف يسخرون مني على المسرح.
يرى الباحثون الذين تحدثوا إلى WIRED بعض علامات التحسن. عندما أنشأت Google نموذج اللغة PaLM 2 ، الذي تم إصداره هذا الشهر ، بذلت جهدًا لزيادة بيانات التدريب غير الإنجليزية لأكثر من 100 لغة. يتعرف النموذج على المصطلحات اللغوية الألمانية والسواحيلية ، والنكات باللغة اليابانية ، وينظف القواعد في اللغة الإندونيسية ، كما تقول Google ، ويتعرف على الاختلافات الإقليمية بشكل أفضل من النماذج السابقة.
ولكن في خدمات المستهلك ، تحافظ Google على PaLM 2 في قفص. يتم تشغيل chatbot Bard الخاص به بواسطة PaLM 2 ولكنه يعمل فقط باللغة الإنجليزية الأمريكية واليابانية والكورية. مساعد الكتابة لـ Gmail الذي يستخدم PaLM 2 يدعم اللغة الإنجليزية فقط. يستغرق الأمر وقتًا لدعم اللغة رسميًا عن طريق إجراء الاختبارات وتطبيق المرشحات للتأكد من أن النظام لا ينتج محتوى سامًا. لم تقم Google باستثمار شامل لإطلاق العديد من اللغات منذ البداية ، على الرغم من أنها تعمل على إضافة المزيد بسرعة.
اكتشاف المزيد من مدونة الواحة
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.