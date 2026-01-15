نجحت أبوظبي في بناء نظام ذكاء اصطناعي يفهم اللغة العربية بشكل أفضل من أي نموذج آخر وفقاً للمقاييس العالمية، كما أنه يحقق ذلك بكونه أصغر حجماً وأسرع من الأنظمة المنافسة التي طورتها شركات التكنولوجيا الكبرى.

يحتل نموذج Falcon-H1 Arabic، الذي طوره معهد الابتكار التكنولوجي (TII)، المركز الأول في قائمة المتصدرين لنماذج اللغات الكبيرة العربية المفتوحة (Open Arabic LLM Leaderboard)، والتي تقيس مدى كفاءة أنظمة الذكاء الاصطناعي في التعامل مع اللغة العربية. ويتفوق النموذج الرائد الذي يضم 34 مليار معامل (parameter) على نموذج "لاما" (Llama-70B) من شركة ميتا، ونموذج "كوين" (Qwen-72B) الصيني، على الرغم من كونه أقل من نصف حجمهما.

بالنسبة للمتحدثين باللغة العربية، فإن التأثير ملموس وعملي. فكل من جرب أدوات الذكاء الاصطناعي الشهيرة باللغة العربية يعرف الفجوة: ردود تبدو صحيحة قواعدياً ولكنها تفتقر إلى المعنى، أو أدوات تفشل في فهم اللهجات، أو ترجمات تتجاهل السياق الثقافي. وقد تم بناء Falcon-H1 Arabic خصيصاً للقضاء على هذه المشكلة.

لا تزال اللغة العربية واحدة من أصعب اللغات التي يمكن للذكاء الاصطناعي نمذجتها؛ حيث تتغير وظيفة الكلمات بناءً على تحولات بسيطة، وترتيب الكلمات مرن، وتتضمن الحياة اليومية تنقلاً بين اللهجات واللغة العربية الفصحى المعاصرة. وغالباً ما تعاني الأنظمة العالمية المدربة بشكل أساسي على اللغة الإنجليزية من هذه التحديات.

وتشير أبحاث في دورية "Communications of the ACM" إلى أن اللغة العربية تفتقر إلى مجموعات بيانات ضخمة وعالية الجودة ومشروحة - خاصة للهجات والكلام غير الرسمي - مما يجعل معظم أنظمة الذكاء الاصطناعي غير مدربة بشكل كافٍ للاستخدام الحقيقي. وتظهر النتيجة يومياً في التعليم، وخدمة العملاء، والخدمات الحكومية، وروبوتات المحادثة الخاصة برعاية الصحية التي تعمل باللغة العربية بشكل أسوأ مما تفعله بالإنجليزية.

تم تدريب Falcon-H1 Arabic على مجموعات بيانات تعتمد "اللغة العربية أولاً"، تغطي اللغة الرسمية، واللهجات الإقليمية، والمحتوى المتجذر ثقافياً. ويأتي النموذج بثلاثة أحجام: 3 مليارات، و7 مليارات، و34 مليار معامل، مما يتيح للمؤسسات الاختيار بناءً على مواردها الحوسبية.

يتفوق أصغر نموذج (3B) على نموذج "فاي-4 ميني" (Phi-4 Mini) من مايكروسوفت بمقدار 10 نقاط مئوية في اختبارات اللغة العربية. كما يتصدر إصدار (7B) فئته. أما النموذج الأكبر (34B) فيتفوق على أنظمة تزيد عن ضعف حجمه، محققاً دقة بلغت 75.36% في اختبارات الفهم الشامل للغة العربية.

وبعيداً عن درجات الأداء، يتعامل النموذج مع المهام التي تهم في الحياة اليومية: فهم العبارات العامية، والاستنتاج باللغة العربية، والحفاظ على محادثات طويلة، وتفسير السياق بدلاً من الترجمة الحرفية كلمة بكلمة. ويمكنه معالجة ما يصل إلى 192,000 كلمة في محادثة واحدة، وهو ما يكفي لتحليل العقود القانونية، أو الأبحاث الأكاديمية، أو السجلات الطبية الكاملة دون فقدان مسار السياق.

وقال فيصل البناي، مستشار رئيس دولة الإمارات والأمين العام لمجلس أبحاث التكنولوجيا المتطورة، إن هذا الإنجاز يمكن المجتمعات الناطقة باللغة العربية من الاستفادة من "ابتكار متاح، ذي صلة، ومؤثر".

يتحدث باللغة العربية أكثر من 450 مليون شخص في أكثر من 20 دولة، ومع ذلك كانت تاريخياً ثانوية في تطوير الذكاء الاصطناعي العالمي. فالعديد من الأنظمة الكبرى "تدعم" العربية فقط كإضافة لنماذج مدربة بالإنجليزية. أما Falcon-H1 Arabic فقد صُمم منذ البداية مع وضع اللغة العربية في قلب عملية التطوير.

وتمتد التداعيات الإيجابية لهذا الإنجاز عبر قطاعات متعددة في الإمارات والمنطقة على نطاق أوسع؛ حيث يمكن للمدارس نشر معلمين افتراضيين يفهمون لغة الطلاب ولهجتهم فعلياً. ويمكن لمزودي الرعاية الصحية استخدام أدوات ذكاء اصطناعي تحترم السياق الثقافي. كما يمكن للشركات أتمتة دعم العملاء دون فقدان الفروق الثقافية الدقيقة، وتستطيع الخدمات الحكومية تشغيل أنظمة دردشة بلغة عربية طبيعية بدلاً من صياغة إنجليزية مترجمة.

حافظت نماذج "فالكون" التابعة لمعهد الابتكار التكنولوجي (TII) باستمرار على المركز الأول في فئاتها منذ عام 2023. ويواصل إصدار H1 Arabic هذا المسار مع سد فجوة طال أمدها: نموذج ذكاء اصطناعي أساسي بني خصيصاً للمتحدثين بالعربية بدلاً من كونه مقتبساً من الإنجليزية.

يتوفر Falcon-H1 Arabic مجاناً عبر الرابط (chat.falconllm.tii.ae)، مما يسمح للمطورين، والشركات الناشئة، والباحثين، والمؤسسات الإعلامية، ومؤسسات القطاع العام ببناء تطبيقات ذكاء اصطناعي عربية تعمل باللغة العربية بطلاقة تماثل طلاقة الأدوات السائدة في اللغة الإنجليزية.