يمكنك الآن دق ناقوس الخطر بشأن سلوك الذكاء الاصطناعي بشكل سيء

يمكنك الآن دق ناقوس الخطر بشأن سلوك الذكاء الاصطناعي بشكل سيء
تفاصيل إضافية:
كتابة مختبر الذكاء الاصطناعي يعني كل أسبوع أنني أحيانًا أواجه نماذج ذكاء اصطناعي تتصرف بشكل سيئ وغريب. عادة، ليس هناك ما يمكنك فعله حيال ذلك، باستثناء مشاركة تلك الحكايات معك. ولكن هذا يمكن أن يتغير قريبا.
أنشأت مجموعة من الباحثين في مجال الذكاء الاصطناعي موقعًا إلكترونيًا جماعيًا، بعنوان Flaw Reporting for AI (FLARE-AI)، للإبلاغ عن أضرار الذكاء الاصطناعي وتتبعها. على سبيل المثال، إذا قام برنامج الدردشة الآلي بإنشاء برامج ضارة أو وصفة لصنع القنابل، أو تسرب معلومات شخصية، أو إثارة التفكير الوهمي لدى المستخدمين، فيمكن استخدام FLARE-AI لدق ناقوس الخطر. تسمح التعليمات البرمجية مفتوحة المصدر خلف النظام للآخرين بالتحقق من المشكلة وتوجيه التقارير إلى صانعي النماذج، بالإضافة إلى منظمات مثل MITRE، وهي منظمة غير ربحية تتعقب مشكلات الأنظمة التقنية. إنه يشبه إلى حد ما Downdetector، الذي يجمع تقارير المستخدم في الوقت الفعلي عن انقطاع الخدمة العالمية التي تؤثر على أشياء مثل التطبيقات ومواقع الويب.
يعد الموقع الإلكتروني خطوة أخرى في عمل المجموعة المستمر فيما يتعلق بتقارير الذكاء الاصطناعي، والتي كتبت عنها لأول مرة في العام الماضي. كما تشاور أعضاء المجموعة أيضًا بشأن مشروع قانون للكونجرس تم الإعلان عنه في يونيو، والذي من شأنه أن يجعل الحكومة الأمريكية تلعب دورًا مركزيًا في تتبع هذا النوع من سوء سلوك الذكاء الاصطناعي.
يقول أفيجيت غوش، الباحث في سياسات الذكاء الاصطناعي في HuggingFace، والذي شارك في قيادة تطوير FLARE-AI مع علماء الكمبيوتر إيلين تشو وشاين لونجبري: “في الوقت الحالي، لا توجد طريقة مركزية وخاضعة للمساءلة للإبلاغ عن العيوب في أنظمة الذكاء الاصطناعي”.
تم تطوير نظام الإنذار بالتعاون مع 49 خبيرًا في الذكاء الاصطناعي من 32 منظمة مختلفة. في ورقة بحثية تلخص العمل، يرى الباحثون أن مبادرتهم يمكن أن تكون حاسمة مع اعتماد الذكاء الاصطناعي على نطاق أوسع ومع اكتساب الأنظمة الوكيلة قوة أكبر. ويعتقدون أن عدم وجود طريقة متسقة للإبلاغ عن عيوب الذكاء الاصطناعي يمثل مشكلة كبيرة.
تقول جيسيكا جي، الباحثة في مركز الأبحاث للأمن والتكنولوجيا الناشئة: “أعتقد أنها مبادرة جيدة حقًا”. يقول جي إن الباحثين على حق في ملاحظة أن آليات الإبلاغ الحالية مجزأة، وأن نماذج الذكاء الاصطناعي هي عبارة عن صناديق سوداء. وتقول: “أنا أدعم أي شيء يجعل الذكاء الاصطناعي أكثر شفافية”.
على الرغم من أن الأخطاء ومشاكل الأمن السيبراني تحظى باهتمام كبير – خاصة في الآونة الأخيرة – أخبرني غوش أن المشكلات المتعلقة بأنظمة الذكاء الاصطناعي تشمل موضوعات مثل الأذى النفسي والتمييز أو التحيز والمعلومات المضللة. ويضيف أن الشركات المختلفة لديها معايير مختلفة حول مثل هذه القضايا، مما يعني أن بعض المشاكل لا يتم التعرف عليها. يقول غوش: “في غياب نظام إفصاح منسق، لا توجد آليات خارجية لفرض الشفافية”.
تُظهر سلسلة من الحوادث الأخيرة التي شملت أدوات الذكاء الاصطناعي الشائعة مدى سهولة تدهور التكنولوجيا.
كشفت شركة تدعى LayerX هذا الأسبوع عن طريقة لخداع متصفحات الويب المدعمة بالذكاء الاصطناعي، بما في ذلك Atlas الخاص بـ OpenAI وPerplexity’s Comet، لاختراق حواجز الحماية الخاصة بها. على سبيل المثال، قد يؤدي إقناع نموذج الذكاء الاصطناعي خلف المتصفح بأنه يلعب لعبة ما إلى تحول المتصفح إلى مارق ومحاولة اختراق موقع ويب. (تقول شركة LayerX إن الشركات المسؤولة عن المتصفحات المتأثرة قامت بإصلاح المشكلة.) وفي شهر أبريل من هذا العام، اكتشف يوهان ريبيرجر، الباحث الأمني، طريقة لخداع كلود لإفشاء البيانات الشخصية باستخدام الصور التي تم إنشاؤها بواسطة ChatGTP.
يقدم الذكاء الاصطناعي أنواعًا جديدة وغريبة من المشكلات أيضًا. في العام الماضي، اضطرت شركة OpenAI إلى تحديث نماذجها بعد أن اكتشفت أنها كانت مفرطة في التملق، الأمر الذي بدا في بعض الأحيان وكأنه يشجع على التفكير الوهمي.
يقول رومان شودري، الرئيس التنفيذي ومؤسس شركة Humane Intelligence PBC، إن FLARE-AI يمكن أن يكون وسيلة مفيدة للعديد من مطوري الذكاء الاصطناعي لتنفيذ طرق الإبلاغ عن المشكلات باستخدام أدواتهم. لكنها تضيف أن مثل هذه المبادرات غالبا ما تصاحبها تحديات خطيرة.
تم جلب وترجمة هذا المقال تلقائيًا بواسطة موقع الواحة التقنية.
اكتشاف المزيد من مدونة الواحة
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.



