هل طور الذكاء الاصطناعي لغة خاصة به؟ وهل علينا أن نخاف؟

robot-gdbd52331c_1920
CC0
  • أحمد حسن
  • الجمعة، 02-09-2022
  • 08:00 ص
يمكن للجيل الجديد من نماذج الذكاء الاصطناعي إنتاج صور "إبداعية" عند الطلب بناءً على أوامر نصية فقط.  وبدأت أمثال Imagen و MidJourney و DALL-E 2 في تغيير طريقة إنشاء المحتوى الإبداعي مع ما يترتب على ذلك من آثار على حقوق النشر والملكية الفكرية.

ومع أن مخرجات هذه النماذج غالبًا ما تكون مذهلة، إلا أنه من الصعب معرفة بالضبط كيف تمت نتائجها، وقدم باحثون في الولايات المتحدة ادعاءً مثيرًا للاهتمام مفاده أن نموذج DALL-E 2 ربما اخترع لغته السرية الخاصة به للتحدث عن الأشياء.

اظهار أخبار متعلقة



من خلال حث DALL-E 2 على إنشاء صور بناء على تعليقات نصية، ثم إعادة التسميات التوضيحية الناتجة (gibberish) إلى النظام، خلص الباحثون إلى أن DALL-E 2 يعتقد أن كلمة Vicootes تعني "الخضروات"، بينما تشير عبارة Wa ch zod rea إلى "الكائنات البحرية التي قد يأكلها الحوت".

هذه الادعاءات رائعة، وإذا كانت صحيحة فقد يكون للأمر تداعيات أمنية مهمة لهذا النوع من نماذج الذكاء الاصطناعي الكبيرة. لكن ما الذي يحدث بالضبط؟ وهل DALL-E 2 لديها لغة سرية؟

ربما لم تكوّن DALL-E 2 "لغة سرية" بعد، ولكن قد يكون لها مفرداتها الخاصة. وحتى ذلك الحين لا يمكننا التأكد من ذلك.

اظهار أخبار متعلقة



في البداية، من الصعب جدًا في هذه المرحلة التحقق من أي ادعاءات حول DALL-E 2 ونماذج الذكاء الاصطناعي الكبيرة الأخرى، لأن عددًا قليلاً فقط من الباحثين والممارسين المبدعين يمكنهم الوصول إليها.

حتى أولئك الذين لديهم إمكانية الوصول يمكنهم فقط استخدام هذه النماذج بطرق محدودة. على سبيل المثال، يمكن لمستخدمي DALL-E 2 إنشاء الصور أو تعديلها، لكن لا يمكنهم (حتى الآن) التفاعل مع نظام الذكاء الاصطناعي بشكل أعمق، مثل تعديل الرمز الموجود خلف الكواليس.

وهذا يعني أن أساليب الذكاء الاصطناعي "القابلة للتفسير" لا يمكن تطبيقها، والتحقيق المنتظم في سلوكها يمثل تحديًا كبيرًا للعلماء.

اظهار أخبار متعلقة



لكن ما الذي يحدث؟

أحد الاحتمالات هو أن العبارات "gibberish" مرتبطة بكلمات من لغات غير الإنجليزية. على سبيل المثال كلمة Apoploe، الذي يبدو أنه يخلق صورًا للطيور تشبه كلمة Apodidae اللاتينية، وهو اسم لعائلة من أنواع الطيور. وهذا على ما يبدو تفسير معقول، لأنه تم تدريب DALL-E 2 على مجموعة متنوعة جدًا من البيانات المأخوذة من الإنترنت، والتي تضمنت العديد من الكلمات غير الإنجليزية.

هل الأمر له علاقة بالترميز؟

إحدى النقاط التي تدعم هذه النظرية هي حقيقة أن نماذج لغة الذكاء الاصطناعي لا تقرأ النص بالطريقة التي نقرأها أنا وأنت. وبدلاً من ذلك هم تقوم بتقسيم نص الإدخال إلى "رموز مميزة" قبل معالجتها.

وبالتالي فإن طرق "الترميز" المختلفة لها نتائج مختلفة. تبدو معاملة كل كلمة كرمز هو بمثابة نهج بديهي، ولكنها تتسبب بالمشاكل عندما يكون للرموز المتطابقة معاني مختلفة مثل كلمة "Match" التي تعني شيئين مختلفين عندما تلعب التنس وعندما ينشب حريق.

اظهار أخبار متعلقة



يستخدم DALL-E 2 (ونماذج أخرى) طريقة وسطية تسمى ترميز زوج البايت BPE. وبالتالي فإن فحص BPE لبعض الكلمات المبهمة يشير إلى أن هذا يمكن أن يكون عاملاً مهمًا في فهم "اللغة السرية".

كما يمكن أن تكون "اللغة السرية" مجرد مثال على مبدأ "garbage in, garbage out". لأن DALL-E 2 لا يستطيع أن يقول "لا أعرف ما الذي تتحدث عنه"، لذلك سينشئ دائمًا نوعًا من الصور من نصوص الإدخال المحدد. في كلتا الحالتين، لا يمثل أي من هذه الخيارات تفسيرات كاملة لما يحدث.

لماذا هذا مهم؟

تعد "اللغة السرية" لـ DALL-E مثالاً على "هجوم معاد" ضد نظام التعلم الآلي: طريقة لكسر السلوك المقصود للنظام عن طريق الاختيار المتعمد للمدخلات التي لا يتعامل معها الذكاء الاصطناعي جيدًا.

أحد أسباب القلق من الهجمات العدائية هو أنها تتحدى ثقتنا في النموذج. إذا قام الذكاء الاصطناعي بترجمة الكلمات المبهمة بطرق غير مقصودة، فقد يفسر أيضًا الكلمات ذات المعنى بطرق غير مقصودة.

اظهار أخبار متعلقة



تثير الهجمات العدائية أيضًا مخاوف أمنية. حيث يقوم DALL-E 2 بتصفية نص الإدخال لمنع المستخدمين من إنشاء محتوى ضار أو مسيء، ولكن "اللغة السرية" من الكلمات غير الصحيحة قد تسمح للمستخدمين بالتحايل على هذه المرشحات.

اكتشفت الأبحاث الحديثة "عبارات تحفيز" معادية لبعض نماذج الذكاء الاصطناعي اللغوية - عبارات قصيرة لا معنى لها مثل "zoning tapping fiennes" التي يمكن أن تؤدي بشكل موثوق إلى إطلاق نماذج لمحتوى عنصري أو ضار أو متحيز. هذا البحث هو جزء من الجهد المستمر لفهم والتحكم في كيفية تعلم أنظمة التعلم العميق المعقدة من البيانات.

اظهار أخبار متعلقة



أخيرًا، تسلط "اللغة السرية" لـ DALL-E 2 الضوء على المخاوف الحالية بشأن متانة أنظمة التعلم العميق وأمانها وقابليتها للتفسير.

إلى أن تصبح هذه الأنظمة متاحة على نطاق أوسع، وحتى يتمكن المستخدمون من مجموعة أكبر من الخلفيات الثقافية غير الإنجليزية من استخدامها، لن نتمكن من معرفة ما يحدث حقًا.

في غضون ذلك، إذا كنت ترغب في تجربة إنشاء بعض صور الذكاء الاصطناعي الخاصة بك، يمكنك التحقق من نموذج متاح مجانًا يدعى DALL-E mini. فقط كن حذرًا من الكلمات التي تستخدمها لتوجيه النموذج.
شارك
التعليقات