بينما تتسابق شركات التكنولوجيا العالمية لبناء أنظمة ذكاء اصطناعي تُولّد مقاطع فيديو ذات واقعية متزايدة، قام باحثون في أبوظبي ببناء شيء مختلف — نموذج يقوم بذلك مع تعلّم كيفية تصرف العالم بمرور الوقت.

كشفت جامعة محمد بن زايد للذكاء الاصطناعي (MBZUAI) عن نموذج "بان"، وهو نموذج ذكاء اصطناعي عالمي قادر على تذكّر الأحداث الماضية، والتنبؤ بالحالات المستقبلية، والاستجابة للتعليمات متعددة الخطوات باتساق شبيه بالإنسان.

أُطلق نموذج بان من قِبل معهد النماذج التأسيسية في الجامعة، وهو يحافظ على الاستمرارية عبر التسلسلات الطويلة، مما يسمح له باتباع تعليمات مثل "انعطف يساراً بعد الجسر" أو "ضع العلبة على الطاولة، ثم تراجع"، مع المحافظة على التخطيط المكاني والتدفق المنطقي للمشهد.

عادةً ما تنتج الأنظمة الحالية مثل "سورا" من OpenAI و"فيو" من جوجل مقاطع غنية بصرياً ولكنها تفقد تتبع الأشياء أو بنية المشهد مع مرور الوقت — وهي فجوة صُمم نموذج PAN لسدّها.

أوضح الباحثون المشاركون في المشروع: "بدلاً من مجرد توليد الفيديو، يفهم PAN ما يحدث في المشهد ويتنبأ بما يجب أن يحدث بعد ذلك."

كيف يحقق بان ذلك؟

يحقق بان ذلك عن طريق تقسيم المهمة إلى مرحلتين:

في البداية: يُكوّن تمثيلاً داخلياً للبيئة — حيث يتعرف على الأشياء والحركة والعلاقات بمرور الوقت. ثانياً: يترجم هذا الفهم إلى فيديو، ويحدثه خطوة بخطوة مع تطور التعليمات. يسمح هذا النهج للنظام بالحفاظ على الاستقرار والواقعية على مدى فترات أطول.

يأتي إطلاق النموذج في الوقت الذي أصبحت فيه تكنولوجيا المحاكاة ذات أهمية متزايدة للروبوتات، والأنظمة الذاتية، والتخطيط الصناعي. إن قدرة PAN على تتبع الأشياء عبر الزمن وتوقع النتائج تجعله أداة محددة لاختبار المواقف التي قد تكون محفوفة بالمخاطر أو مكلفة للغاية أو غير عملية لإعادة إنشائها في العالم المادي.

متاح للاستخدام العام

تم تطوير بان بواسطة فرق جامعة محمد بن زايد للذكاء الاصطناعي في أبوظبي وباريس ووادي السيليكون، وهو جزء من نماذج متعددة يتم إطلاقها من العاصمة، في خطوة لوقف الاعتماد على التكنولوجيا المستوردة. النموذج ووثائقه الفنية متاحان للجمهور على الموقع الإلكتروني panworld.ai، مما يضع الإمارات ضمن مجموعة صغيرة من الدول والمؤسسات التي تنتج نموذج الذكاء الاصطناعي العالمي لاستخدامه في البحث المفتوح.

بينما تتجه الشركات العالمية الآن نحو أنظمة ذاتية أكثر أماناً وتخطيط أكثر موثوقية، يقدم PAN بديلاً للنماذج التي تركز فقط على الجودة البصرية. فبدلاً من عرض مقاطع قصيرة، يوفر فهماً منظماً لكيفية تأثير الإجراءات على النتائج المستقبلية — وهي قدرة يقول الباحثون إنها تقرب الذكاء الاصطناعي خطوة من التفكير الحقيقي وفهم العالم المادي.