أكدت الدكتورة ابتسام المزروعي، رئيس وحدة الذكاء الاصطناعي ومسؤول مشاريع النماذج اللغوية الكبيرة في معهد الابتكار التكنولوجي في أبوظبي، أن «فالكون» نموذج لغوي إماراتي طور بالكامل في أبوظبي ويتفوق على العديد من روبوتات الدردشة الحالية، ويهدف إلى تعزيز قدرات الشركات الحكومية والخاصة، مما يضع الدولة في سباق تحدي الذكاء الاصطناعي.
وقالت المزروعي لـ«البيان»: إن «فالكون» أحد النماذج اللغوية الضخمة والمرتقب طرحه واستخدامه رسمياً، حيث إنه في مرحلة ما قبل التدريب، وهو شبيه ببرامج الروبوتات ويتفوق على Chat GPT3، مشيرة إلى أن برامج الروبوتات والتي أصحبت تستخدم عالمياً على نطاق واسع قادرة على صياغة النصوص الإبداعية وحل المشكلات المعقدة وتقديم الفائدة لشريحة كبيرة من الناس من خلال استخدامها في مختلف التطبيقات مثل روبوتات الدردشة والمساعد الافتراضي والترجمة وإنشاء المحتوى وتحليل الآراء، كما يمكنها مساعدة الشركات على تنظيم أنشطة خدمة العملاء لديها من خلال تقديم ردود فعالة على استفسارات العملاء.
نموذج ضخم
وأوضحت أن «فالكون» يعد نموذجاً لغوياً ضخما طُوّر بالكامل في أبوظبي باستخدام أدوات مصممة خصيصاً للمعالجة المسبقة للبيانات وتدريب النماذج، ويتضمن 40 مليار عامل متغير وقد تم تدريبه على 1 تريليون من الرموز المميزة «tokens» باستخدام 384 وحدة معالجة رسومات على AWS، لافتة إلى أنه يتفوق على نموذج GPT-3 من حيث الأداء والتكلفة ويتطابق مع أداء نماذج لغوية كبيرة مماثلة مثل Chinchilla من شركة ديب مايند، ونظيره PaLM-62B من غوغل، ويستطيع «فالكون» أداء مجموعة واسعة من المهام مثل: «التلخيص والإجابة عن أسئلة المستندات وكتابة الإعلانات وما إلى ذلك»، من خلال إعطائه التعليمات مباشرة.
جودة المحتوى
وأشارت إلى أن ما يميز «فالكون» عن تطبيقات الذكاء الاصطناعي الأخرى بأنه تم تطويره باستخدام أدوات متخصصة بالاستفادة من مجموعة بيانات فريدة، حيث يعمل على استخراج محتوى عالي الجودة من بيانات الويب واستخدام كود أساسي مخصص للتدريب بشكل مختلف ومستقل عن إطار العمل المتبع لدى شركات مثل NVIDIA أو Microsoft أو HuggingFac، مضيفة أنه تم التركيز بشكل خاص على جودة البيانات واسعة النطاق، حيث تعرف النماذج اللغوية الكبيرة بأنها حساسة جداً لجودة بيانات التدريب الخاصة بها، ولذلك تم الاهتمام بشكل كبير ببناء مجموعة بيانات من شأنها أن تتعامل مع عشرات الآلاف من نوى وحدة المعالجة المركزية بهدف المعالجة السريعة، الأمر الذي يسهم في استخراج محتوى عالي الجودة من الويب باستخدام العمليات المكثفة للفلترة وإلغاء التكرار.
استخدامات
وعن أوجه استخدامات «فالكون» قالت د. ابتسام المزروعي: لا شك في أنه سيساعد الشركات الإماراتية خصوصاً الناشئة على أن تصبح أكثر كفاءة من حيث تبسيط العمليات الداخلية وإتاحة الوقت للموظفين للتركيز على الأمور المهمة، أما على المستوى الفردي، ستتمكن روبوتات الدردشة التي تعتمد عليه من دعم المستخدمين في حياتهم اليومية بصورة أكثر فعالية، كما يوفر «فالكون» للإمارات نموذجاً لغوياً كبيراً خاصاً بها يمكن استخدامه من قبل المؤسسات الحكومية والشركات الخاصة، وطموحنا في نهاية المطاف طرح النموذج للاستخدام، وأن نصبح أقل اعتماداً على التطبيقات اللغوية الخاصة بعمالقة التكنولوجيا في عالم الذكاء الاصطناعي.
في السياق أوضحت د. ابتسام المزروعي أن «فالكون» أنهى مرحلة ما قبل التدريب والآن بصدد إعداد نسخ محسنة من النموذج من خلال الضبط الدقيق متعدد المهام والتعلم المعزز من ردود الفعل البشرية، وهذا الأمر سيجعل النموذج منسجماً بشكل أفضل مع نية المستخدم وأداء المهام بمزيد من الكفاءة كما سيؤدي ذلك إلى تمكينه من التصرف بشكل فطري مثل روبوتات الدردشة ChatGPT.
منصة للأبحاث
وعن بناء نظام ذكاء اصطناعي من هذا النوع، قالت رئيس وحدة الذكاء الاصطناعي بمعهد الابتكار، إن نجاح نموذج «فالكون» مثال على أهمية التعاون والعمل الجماعي، فعندما يكون لديك عقول عظيمة تعمل معاً لتحقيق نتائج رائعة فلا شيء صعب، ولقد بدأنا الخطة في صيف 2022 والهدف هو بناء أحد أقوى النماذج اللغوية في العالم، إضافة إلى ذلك، سيعمل النموذج على شكل منصة لأبحاث الذكاء الاصطناعي وتسويقها على نطاق واسع، وبذلك يعد مساهماً في ترسيخ مكانة دولة الإمارات بصفتها لاعباً رئيسياً في السباق المستمر نحو بناء نماذج لغوية متطورة.