عند مواجهة طفل يصرخ بأعلى صوته في المنزل ويلقي الطعام على الأرض، قد يتفاجأ الآباء المنهكون عند سماع أن نسلهم الغالي قد يكون أذكى متعلم في الكون كله.
إلا أن بعض علماء الكمبيوتر أدركوا هذه الحقيقة منذ زمن طويل، ولذلك، يحاولون الآن محاكاة قدرات المعالجة الاستثنائية للأطفال في تطوير نماذج الذكاء الاصطناعي.
وقد تبدو أحدث إبداعاتنا التكنولوجية في بعض الأحيان ساحرة في قدراتها، لكن عندما يتعلق الأمر بقدرات التعلم الذاتي فهي قد تبدو بغاية السخافة والحماقة. فهل يمكن تدريبها على التعلم مثلما تفعل وحدات معالجة الأطفال من خلال استكشاف البيانات الجزئية والفوضوية في العالم الحقيقي؟ يحاول بالفعل فريق من الباحثين بجامعة نيويورك القيام بذلك، ونشروا نتائجهم هذا الشهر في مجلة «ساينس».
واستخدمت تجربتهم بيانات من كاميرا خفيفة الوزن مثبتة برأس طفل يعيش في أديلايد يدعى «سام»، حيث سجلت 61 ساعة من حياته من عمر 6 إلى 25 شهراً. وتمت معالجة محتوى الفيديو، بما في ذلك الصور والأصوات المشوشة للآباء والقطط واللهو والألعاب إلى 600 ألف إطار فيديو و37 ألف «عبارة» منسوخة، ثم تم إدخال ذلك كله في شبكة عصبية.
وتمثل التحدي في مطابقة ما رآه «سام» خلال ما يقرب من 1% من ساعات يقظته مع الأصوات التي سمعها، لابتكار نموذج ذكاء اصطناعي متعدد الوسائط. لكن كيف يفهم الطفل أن كلمة «كرة» ترتبط بأنواع مختلفة من الأشياء المستديرة والمطاطية والمتعددة الألوان؟
ويختلف علماء الإدراك حول التفسير، لكنهم يتفقون جميعاً على أن الأطفال هم متعلمون مهرة بشكل لا يصدق، وقادرون على الاستنتاج من مدخلات محدودة. وخلال الفترة العمرية بين 6-9 أشهر، يبدأ الأطفال في ربط الكلمات بالصور، وقبل عمر الثانية، يكونون قد تعلموا متوسط 300 كلمة، وهي في الغالب أسماء.
في المقابل، فإنه حتى هذه اللحظة، كانت محاولات تطوير نماذج ذكاء اصطناعي متعدد الوسائط يمكنها الجمع بين النصوص والصور والأصوات ومقاطع الفيديو، تعتمد في الغالب على استخدام قوة حوسبة ضخمة مع كميات هائلة من البيانات المختارة المنسقة. لكن الباحثين في جامعة نيويورك وجدوا أن نموذجهم نجح في ربط الصور والأصوات ببيانات أقل كثيراً من خلال مدخلات فيديو لطفل واحد. وقد بلغ معدل دقة نموذجهم 61.6% عندما تعلق الأمر بتصنيف 22 مفهوماً بصرياً.
وخلال مقابلة بالفيديو، قال واي كين فونغ، المؤلف الرئيسي للدراسة الخاصة بجامعة نيويورك: «لقد فوجئنا أن هذا النموذج أمكنه إظهار قدرة مذهلة من التعلم بالنظر إلى البيانات المحدودة المتوفرة». وتشكل هذه النتائج دافعاً مشجعاً لتطوير نماذج الذكاء الاصطناعي في المستقبل، وأضاف فونغ إن هذه النتائج تؤكد - أيضاً - على قدرات التعلم الهائلة لدى الأطفال أنفسهم، الذين يمكنهم الاستجابة للإشارات البصرية وتطوير فرضيات تعلمهم الخاصة.
وجزء من سبب نضجهم هو أن الأطفال الرضع يقضون وقتاً طويلاً بدرجة غير عادية في استكشاف العالم بفاعلية قبل الاضطرار إلى الاعتماد على أنفسهم. وكتبت أليسون جوبنيك في كتابها «الطفل الفلسفي»: «الأطفال هم قسم الأبحاث والتطوير للجنس البشري، إنهم يتأملون السماء الزرقاء، وقادرون على تقديم أفكار مبتكرة عبر عصفهم الذهني، في حين يمثل البالغون قسم الإنتاج والتسويق».
ووفقاً لجوبنيك، وهي أستاذة علم النفس بجامعة كاليفورنيا في بيركلي، يتمتع الأطفال بثلاث مهارات أساسية تفتقر إليها أنظمة الذكاء الاصطناعي، أولاً يتفوق الأطفال في خلق نماذج تخيلية، مما يخلق إطاراً مفاهيمياً لتفسير العالم. كما أنهم شخصيات فضولية ومحبة للمغامرة ومتعلمون متجسدون، يستكشفون بنشاط بيئات جديدة، بدلاً من أن يكونوا محصورين على نحو غير فعال بأوامر البرمجة. بالإضافة إلى ذلك، فالأطفال كائنات اجتماعية، يتعلمون من كل من يتفاعل معهم، ويسهم ذلك في تطوير مهارات التعاطف وحب الغير والحس الأخلاقي.
وتقول جوبنيك - في رسالة بالبريد الإلكتروني - إن دراسة جامعة نيويورك «المذهلة» تظهر أن نماذج الذكاء الاصطناعي يمكنها استخلاص المعلومات اللغوية من بيانات التجارب التي يختبرها الأطفال. وكما يوضح مؤلفو الدراسة، يستخدم الأطفال - أيضاً - بيانات مختلفة، يكتسبونها من التجربة النشطة والتفاعل الاجتماعي. ونجاح النماذج، الذي لا يزال محدوداً، قد يستفيد من قدرات التجربة والتعلم الاجتماعي للأطفال، ولكن ذلك لا يعني أن لديهم هذه القدرات، حسب ما كتبته جوبنيك.
وسيتطلب الأمر الكثير من البحث لمضاهاة ما يتعلمه الأطفال بشكل طبيعي باستخدام الحاسوب. لكن، كيف يمكننا بناء آلات تظهر المنطق السليم والتفكير الاجتماعي؟ فقد تكون نماذج الذكاء الاصطناعي قادرة على تعلم الأسماء المرتبطة بالأشياء المادية، لكنها لا تزال تواجه صعوبة مع المفاهيم المجردة والأفعال.
وهكذا، فإنه على الرغم من التقدم المذهل في مجال الذكاء الاصطناعي، لا يزال لدينا الكثير لنتعلمه من حزمة الأدوات البيولوجية الصغيرة التي تشكل دماغ الأطفال.