ابتكار ذكاء اصطناعي يمكنه إنشاء مقطوعات موسيقية من مدخلات النص

الأحد، 29 يناير 2023 08:00 م
ابتكار ذكاء اصطناعي يمكنه إنشاء مقطوعات موسيقية من مدخلات النص الذكاء الاصطناعى
كتبت هبة السيد

مشاركة

اضف تعليقاً واقرأ تعليقات القراء
ابتكر باحثو جوجل ذكاءً اصطناعيًا يمكنه إنشاء مقطوعات موسيقية من مدخلات النص - على غرار الطريقة التي يمكن بها لـ ChatGPT تحويل أمر نصي إلى قصة ويقوم DALL-E بإنشاء صور من المطالبات المكتوبة. 
 
يمكن لبرنامج الذكاء الاصطناعي تحويل إدخال النص إلى ثوان، وحتى موسيقى مدتها دقائق، بالإضافة إلى تحويل الألحان المزعجة إلى آلات أخرى.
 
وفقًا للبحث المنشور على Github ، يُطلق على نموذج AI اسم MusicLM ، وقد قامت الشركة بتحميل سلسلة من العينات التي أنتجتها باستخدام النموذج. 
 
تسمى العينات MusicCaps وهي أساسًا مجموعة بيانات تتكون من 5.5 ألف زوج من أزواج نصوص موسيقية، مع أوصاف نصية منسقة مقدمة من خبراء بشريين.
 
"نقدم MusicLM ، وهو نموذج يولد موسيقى عالية الدقة من أوصاف نصية مثل" لحن كمان مهدئ مدعوم بفرقة غيتار مشوهة ".
 
 قالت الشركة في البحث المنشور إن MusicLM تصوّر عملية توليد الموسيقى الشرطي كمهمة نمذجة تسلسل إلى تسلسل هرمي ، وتولد موسيقى عند 24 كيلو هرتز تظل متسقة على مدار عدة دقائق.
 

الذكاء الاصطناعي ينشئ من Google ألحانًا مدتها 5 دقائق

 
تتضمن الأمثلة مقاطع مدتها 30 ثانية بالإضافة إلى موسيقى طويلة مدتها 5 دقائق تبدو وكأنها أغانٍ فعلية.
 
 لقد تم إنشاؤها من خلال أوصاف طويلة الفقرة، وكلما كانت الإرشادات أكثر وضوحًا ، كانت الموسيقى أفضل.
 
 علاوة على ذلك، تشمل الأمثلة أيضًا النوع والحيوية وحتى الأدوات المحددة.
 
"يتم إنشاء الصوت من خلال توفير سلسلة من المطالبات النصية. 
 
وقال الباحثون إن هذه تؤثر على كيفية استمرار النموذج في الرموز الدلالية المشتقة من التسمية التوضيحية السابقة.
 
 
يتم إعطاء النموذج أساسًا لوضع القصة إدخالات نصية متعددة مع مدة زمنية لكل نوع من أنواع الموسيقى التي يجب إنشاؤها.
 
على سبيل المثال:
 
وقت التأمل (0: 00-0: 15).
 
وقت الاستيقاظ (0: 15-0: 30).
 
وقت الجري (0: 30-0: 45).
 
وقت إعطاء 100% (0: 45-0: 60).
 
"تُظهر تجاربنا أن MusicLM يتفوق في الأداء على الأنظمة السابقة من حيث جودة الصوت والالتزام بالوصف النصي. 
 
علاوة على ذلك لاحظ الباحثون أن MusicLM يمكن أن يكون مشروطًا بكل من النص واللحن من حيث أنه يمكن أن يحول ألحان الصفير والهمهمة وفقًا للأسلوب الموصوف في تعليق نصي.
 






مشاركة






الرجوع الى أعلى الصفحة