كشف باحثو شركة أبل عن بعض الأخطاء المنطقية الخطيرة فى استدلال الذكاء الاصطناعى التوليدى، خاصة عندما يتعلق الأمر بالأرقام والرياضيات، ما يدل على فشل الذكاء الاصطناعى، فى تقديم حلول تتعلق بالعمليات الرياضية المعقدة والأساسية فى المدارس الابتدائية.
الذكاء الاصطناعى يفشل فى حل العمليات الرياضية المعقدة
أظهرت ورقة بحثية نُشرت حديثًا من قبل ستة باحثين في شركة أبل، أن الاستدلال الرياضى الذى تستخدمه نماذج اللغة الكبيرة المتقدمة (LLMs) قد يكون غير دقيق وهش، فقد استعان الباحثون بالذكاء الاصطناعى، لحل مجموعة بيانات من أسئلة الرياضيات المتنوعة لغويًا في المدارس الابتدائية، ومجموعتها الموحدة المكونة من 8000 مسألة رياضية على مستوى المدارس الابتدائية، ثم قام الباحثون بتغيير الصياغة قليلاً دون تغيير منطق المشكلة وأطلقوا على هذا الاختبار اختبار GSM-Symbolic.
دراسة تكشف عن فشل جديد للذكاء الاصطناعى أمام صعوبة علم الرياضيات
وقد سجلت المجموعة الأولى من الاختبارات انخفاضًا في الأداء بنسبة تتراوح بين 0.3% و9.2%، أما المجموعة الثانية، التي تضمنت بيانًا في بعض المشكلات التي لا علاقة لها بالإجابة، فقد أظهرت "انخفاضًا كارثيًا في الأداء" من حوالي 17.5% إلى 65.7%.
وخلصت الدراسة بأن الذكاء الاصطناعي يكافح مع أجل حل بعض المهام البسيطة المتعلقة بالأرقام، ما يؤكد في الواقع، عن فشله في الإجابة عن العمليات الرياضية بشكل صحيح، لكنه يستخدم بدلاً من ذلك "مطابقة الأنماط" البسيطة لتحويل البيانات إلى عمليات دون فهم حقيقي.
وأكد الباحثون أن الذكاء الاصطناعي يميل إلى الفشل في حل المشكلات الرياضية البسيطة لأن الكلمات كانت مربكة للغاية أو لم تتبع النمط الدقيق، كما يبدو أن الذكاء الاصطناعي يعطي وهم "الاستدلال" ويعتمد بدلاً من ذلك على تخزين البيانات ثم معالجتها.
تم أضافة تعليقك سوف يظهر بعد المراجعة