مسح مهندسون يعملون لدى OpenAI أدلة محتملة عن طريق الخطأ في دعوى انتهاك حقوق الطبع والنشر التي رفعها ناشرو الأخبار، The New York Times وDaily News ضد شركة الذكاء الاصطناعي الناشئة، وكجزء من الإجراءات القانونية، وافقت OpenAI على السماح لمحامي الناشرين بالاطلاع على مجموعات بيانات تدريب الذكاء الاصطناعي الخاصة بها بحثًا عن أي من محتوياتهم المحمية بحقوق الطبع والنشر.
وفقا لما ذكره موقع "Indian express"، فإنه اعتبارًا من 1 نوفمبر، بدأ فريق من المحامين والخبراء في البحث في بيانات تدريب OpenAI على الآلات الافتراضية التي أنشأتها الشركة، ومع ذلك، في 14 نوفمبر، زعم محامو الناشرين أن بيانات البحث المخزنة على أحد الآلات الافتراضية بعد 150 ساعة من العمل قد اختفت.
وبينما تمكنت OpenAI من استرداد معظم البيانات المحذوفة، قال المحامون إن البيانات المستردة لم تتضمن أسماء الملفات وبنية المجلد.
ونتيجة لذلك، قال المحامون في رسالة رفعوها إلى محكمة مقاطعة أمريكية: "لا يمكن استخدامها لتحديد المكان الذي استُخدمت فيه المقالات المنسوخة للمدعين الإخباريين لبناء نماذج OpenAI".
وجاء في الرسالة: "أُجبر المدعون الإخباريون على إعادة إنشاء أعمالهم من الصفر باستخدام ساعات عمل كبيرة ووقت معالجة الكمبيوتر".
وأضافت: "علم المدعون الإخباريون بالأمس فقط أن البيانات المستردة غير قابلة للاستخدام وأن أسبوعًا كاملاً من عمل الخبراء والمحامين يجب إعادة إنجازه، ولهذا السبب يتم تقديم هذه الرسالة التكميلية اليوم".
وفي حين أقر محامو الناشرين بأن محو البيانات لم يتم عن قصد من قبل OpenAI، فقد أكدوا أن الشركة كانت "في أفضل وضع للبحث في مجموعات البيانات الخاصة بها".
وفي مواجهة دعاوى قضائية متعددة من قبل الناشرين الذين يزعمون انتهاك حقوق النشر، زعمت OpenAI أن تدريب نماذج الذكاء الاصطناعي الخاصة بها على البيانات المتاحة للجمهور مثل المقالات الإخبارية التي نشرتها صحيفة نيويورك تايمز يشكل استخدامًا عادلاً لمثل هذا المحتوى.
ومن ناحية أخرى، أبرمت الشركة المصنعة لـ ChatGPT أيضًا صفقات ترخيص محتوى مع مجموعة من الناشرين الرئيسيين بما في ذلك رويترز، وأسوشيتد برس، وفاينانشال تايمز، وأكسل سبرينجر، الشركة الأم لـ Business Insider وPolitico.