ويأتي إطلاق شركة غوغل لنموذج جيميناي، الذي يُزعم أنه نوع جديد تماما من نماذج الذكاء الاصطناعي وأقوى نموذج للشركة حتى الآن، ليشير إلى أن شتاء الذكاء الاصطناعي الجديد لن يأتي في أي وقت قريب.
إظهار أخبار متعلقة
في الواقع، على الرغم من أن الأشهر الاثني عشر التي تلت إطلاق تشات جي بي تي كانت عاما رائعا بالنسبة للذكاء الاصطناعي، إلا أن هناك سببا وجيها للاعتقاد بأن طفرة الذكاء الاصطناعي الحالية بدأت للتو.
لم تكن لدى OpenAI توقعات عالية عندما أطلقت "نسختها البحثية الرئيسية" المسماة تشات جي بي تي في تشرين الثاني/ نوفمبر 2022.
لقد كانت مجرد اختبار لواجهة جديدة لنماذج اللغات الكبيرة المولدة للنصوص (LLMs).
إظهار أخبار متعلقة
لكن قدرة روبوت الدردشة على القيام بمجموعة واسعة من الأشياء، بدءا من تجميع المقالات والشعر إلى الإجابة على مشكلات البرمجة، أثارت إعجاب الكثير من الناس وأثارت مخاوفهم، وأشعلت النار في صناعة التكنولوجيا.
عندما أضافت OpenAI برنامج GPT-4 LLM الجديد إلى تشات جي بي تي، شعر بعض الخبراء بالذعر لدرجة أنهم توسلوا إلى الشركة لإبطاء وتيرة عملها.
هناك القليل من المؤشرات بالفعل على أن أي شخص استجاب للتحذير هذا. من غير المتصور الآن أن غوغل قد رفعت حجم الرهان - وربما غيرت أيضا قواعد اللعبة - من خلال الإعلان عن جيميناي.
كانت غوغل قد سارعت بالفعل إلى تقديم استجابة مباشرة لتشات جي بي تي على شكل نموذج Bard للذكاء الاصطناعي في وقت سابق من هذا العام، وأطلقت أخيرا تقنية LLM chatbot التي طورتها في وقت سابق لـ OpenAI، ولكنها اختارت الحفاظ على خصوصيتها.
ومع إطلاقها لجيميناي، تدعي أنها فتحت حقبة جديدة تتجاوز LLMs المرتكزة بشكل أساسي على النص، مما يمهد الطريق لجولة جديدة من منتجات الذكاء الاصطناعي، تختلف بشكل كبير عن تلك التي يتيحها تشات جي بي تي.
تطلق غوغل على جيميناي نموذجا "متعدد الوسائط محليا"، مما يعني أنه يمكنه التعلم من البيانات بما يتجاوز النص فقط، كما يمكنه أيضا الحصول على رؤى من الصوت والفيديو والصور. يُظهر تشات جي بي تي كيف يمكن لنماذج الذكاء الاصطناعي أن تتعلم قدرا رائعا عن العالم إذا تم توفير نص كافٍ.
وقد جادل بعض الباحثين في مجال الذكاء الاصطناعي، بأن مجرد جعل النماذج اللغوية أكبر، من شأنه أن يزيد من قدراتها إلى درجة منافسة لقدرات البشر.
ولكن لا يمكنك تعلم الكثير عن الواقع المادي من خلال مرشح النص الذي كتبه البشر عنه، والمحدودية التي يصعب التخلص منها في LLMs مثل GPT-4 - مثل المعلومات المهلوسة، والمنطق الضعيف، وعيوبها الأمنية - تشير إلى أن توسيع نطاق التكنولوجيا الحالية له حدوده.
إظهار أخبار متعلقة
قبل إعلان جيميناي بالأمس، تحدثت WIRED مع ديميس هاسابيس، المدير التنفيذي الذي قاد تطوير جيميناي، والذي تشمل إنجازاته السابقة قيادة الفريق الذي طور الروبوت الخارق AlphaGo.
لقد كان مبالغا كما هو متوقع بشأن برنامج جيميناي، مدعيا أنه يقدم قدرات جديدة من شأنها أن تجعل منتجات غوغل بارزة في نهاية المطاف.
لكن هاسابيس قال أيضا؛ إنه من أجل تقديم أنظمة ذكاء اصطناعي يمكنها فهم العالم بطرق لا تستطيع روبوتات الدردشة اليوم القيام بها، سيتعين دمج LLMs مع تقنيات الذكاء الاصطناعي الأخرى.
يخوض هاسابيس منافسة شرسة مع شركة OpenAI، لكن يبدو أن المنافسين متفقون على أن هناك حاجة إلى أساليب جديدة جذرية.
يشير مشروع غامض قيد التنفيذ في OpenAI، يسمى Q*، إلى أن الشركة تستكشف أيضا أفكارا تتضمن القيام بما هو أكثر من مجرد توسيع نطاق أنظمة مثل GPT-4.
يتناسب هذا مع التصريحات التي أدلى بها سام ألتمان، الرئيس التنفيذي لشركة OpenAI، في معهد ماساتشوستس للتكنولوجيا في نيسان/ أبريل، عندما أوضح أنه على الرغم من نجاح تشات جي بي تي، فإن مجال الذكاء الاصطناعي يحتاج إلى فكرة جديدة كبيرة لتحقيق مزيد من التقدم الكبير.
وقال ألتمان: "أعتقد أننا في نهاية العصر الذي ستكون فيه هذه النماذج عملاقة، عملاقة.. سوف نجعلها أفضل بطرق أخرى".
ربما تكون غوغل قد أظهرت للتو نهجا يمكنه تجاوز تشات جي بي تي، ولكن ربما تكون الرسالة الأكثر بروزا من إطلاق جيميناي، هي أن غوغل عازمة على التوجه نحو شيء أكثر أهمية من روبوتات الدردشة اليوم - تماما كما يبدو أن OpenAI أيضا.