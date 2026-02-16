تلقى باحث في جامعة محمد بن زايد للذكاء الاصطناعي جائزة من جوجل بقيمة مليون دولار لدعم العمل الذي يتناول قيودًا طويلة الأمد في أنظمة الذكاء الاصطناعي: أداؤها غير المتكافئ في اللغة العربية مقارنة بالإنجليزية.

يقود البحث الأستاذة ثمار سولوريو، نائب وكيل الجامعة في جامعة محمد بن زايد للذكاء الاصطناعي، وسيركز على تطوير أنظمة ذكاء اصطناعي قليلة الموارد.

صُممت هذه الأنظمة لفهم اللهجات العربية والسياق الثقافي والاستخدام اليومي دون الاعتماد على الكميات الكبيرة من البيانات المصنفة يدويًا التي شكلت نماذج اللغة الإنجليزية.

يتحدث اللغة العربية أكثر من أربعمائة مليون شخص في أكثر من ستة وعشرين دولة. على الرغم من هذا النطاق، غالبًا ما تُعامل كلغة قليلة الموارد في تطوير الذكاء الاصطناعي. يقول الباحثون إن المشكلة تكمن في كيفية جمع البيانات العربية وهيكلتها، وليس في توفرها.

“يأتي الكثير من البيانات العربية المستخدمة في التدريب من مقالات إخبارية مقتبسة أو نصوص دينية،” قالت نور الحسن، مؤسسة Arabic.ai. “ما ينقص هو الكلام اليومي، واللغة الغنية باللهجات، والمحتوى المرتبط بمجالات محددة والاستخدام في العالم الحقيقي.”

تؤثر هذه الفجوات على أداء أدوات الذكاء الاصطناعي في الإعدادات اليومية. غالبًا ما تواجه الأنظمة المدربة على بيانات عربية محدودة أو رسمية صعوبة في التعامل مع التباين اللهجي، والمراجع الثقافية، والسياق.

في مجال الرعاية الصحية، قد تقدم الأدوات الآلية إرشادات يعتبرها المستخدمون غير مناسبة أو غير متوافقة مع الأعراف الاجتماعية.

في التعليم، يمكن لأنظمة التدريس أن تفسر المواد الثقافية أو الدينية بشكل خاطئ.

تطرح اللغة العربية أيضًا تحديات هيكلية لنماذج اللغة. تعمل اللغة عبر شكلين أساسيين.

تسيطر اللغة العربية الفصحى الحديثة على الكتابة الرسمية ووسائل الإعلام، بينما تختلف اللهجات المنطوقة بشكل كبير عبر المناطق وتسيطر على التواصل اليومي.

تُدرب معظم نماذج اللغة الكبيرة بشكل مكثف على النصوص الرسمية، مما يحد من قدرتها على معالجة اللغة القائمة على اللهجات.

يمكن أن يتغير معنى الكلمة حسب الجغرافيا. كلمة “بس” يمكن أن تعني “فقط” في مصر، و“لكن” في بلاد الشام، و“كفى” في اللهجة الخليجية. هذه الفروق تغير معنى الجملة وتظل صعبة على النماذج الحالية حلها باستمرار.

“يسمح لنا هذا التمويل بالانتقال من البحث الاستكشافي إلى الأنظمة التطبيقية ذات الصلة المباشرة بحياة الناس،” صرح البروفيسور سولوريو لصحيفة الخليج تايمز.

“إنه يدعم التحول نحو نماذج ترتكز على الحقائق اللغوية والثقافية لمنطقة الشرق الأوسط وشمال إفريقيا.”

يسعى المشروع إلى معالجة أوجه القصور في تطوير نماذج اللغة العربية الحالية. فبدلاً من تكييف الأنظمة المصممة أصلاً للغة الإنجليزية، سيقوم البحث بإنشاء أطر عمل مصممة خصيصًا للغة العربية واللغات الإقليمية الأخرى.

يركز البحث على تحسين فهم النظام للغة العربية كما يتم التحدث بها واستخدامها في الحياة اليومية، بدلاً من الاعتماد على الترجمة وحدها.

يهدف النهج قليل الموارد إلى تقليل الاعتماد على مجموعات البيانات الكبيرة المشروحة وخفض متطلبات الحوسبة.

قالت جوجل إن المنحة تتماشى مع مبادراتها الإقليمية الأوسع. “نحن نمضي قدمًا في التزامنا بتوسيع الوصول إلى تقنيات الذكاء الاصطناعي المبتكرة باللغة العربية ولهجاتها،” قال يوسي ماتياس، نائب الرئيس في جوجل ورئيس أبحاث جوجل.

سيدعم التمويل أيضًا باحثي ما بعد الدكتوراه والباحثين في بداية حياتهم المهنية. تركز أبحاث الذكاء الاصطناعي تاريخيًا في المؤسسات الغربية التي لديها إمكانية الوصول إلى ميزانيات حوسبة كبيرة.

طورت جامعة محمد بن زايد للذكاء الاصطناعي (MBZUAI) سابقًا أنظمة تركز على اللغة العربية مثل Jais 2 و K2 Think، وكلاهما تطلب بنية تحتية كبيرة.

يقول الباحثون المشاركون في المشروع إن التقدم في الذكاء الاصطناعي العربي لا يزال محدودًا بسبب التعاون المجزأ عبر المنطقة وضعف التكامل بين الأوساط الأكاديمية والصناعة.

تهدف مبادرة سولوريو إلى معالجة هذه القيود من خلال إنتاج أطر عمل مفتوحة يمكن للجامعات والشركات الناشئة والمؤسسات العامة في جميع أنحاء المنطقة اعتمادها دون استثمار رأسمالي كبير.

تشمل التطبيقات المحتملة التعليم والرعاية الصحية والحفاظ على الثقافة والاتصالات الرقمية.

مع توسع تبني الذكاء الاصطناعي في جميع أنحاء المنطقة، تظل اللغة عاملاً رئيسيًا في الوصول وسهولة الاستخدام.