سیستم هوش مصنوعی جدید گوگل می تواند با استفاده از توضیحات متنی یک قطعه موسیقی را در هر ژانری تولید کند؛ اما این فناوری هنوز در دسترس همه قرار نگرفته است.
به نقل از ورج، محققان گوگل سیستم هوش مصنوعی جدیدی را ساختند که میتواند قطعات موسیقی چند دقیقهای را از پیامهای متنی تولید و حتی ملودی سوت یا زمزمه را به سازهای دیگر تبدیل کند.
گوگل قطعههای 30 ثانیهای از آنچه شبیه آهنگهای واقعی به نظر میرسد منتشر کرده این قطعات از توضیحات طولانی ایجاد شدهاند. این ویژگی احتمالا برای همه در دسترس نباشد. این مدل MusicLM نام دارد و حتی میتواند صدای انسان را شبیهسازی کند.
مطمئناً این مدل اولین سیستم هوش مصنوعی مولد برای آهنگ نیست. تلاشهای دیگری نیز از جمله Riffusion ، Dance Diffusion، AudioML گوگل و Jukebox OpenAI انجام شده است. اما هیچکدام به دلیل محدودیتهای فنی و دادههای آموزشی محدود، نتوانستهاند آهنگهایی بهویژه از نظر آهنگسازی پیچیده یا با کیفیت بالا تولید کنند. MusicLM شاید اولین موردی باشد که این توانایی را دارد.
این مدل روی مجموعه دادهای از 280هزار ساعت موسیقی آموزش دید تا یاد بگیرد که آهنگهای منسجمی بسازد. آهنگهای آن، بهطور قابلتوجهی شبیه موارد تولید شده توسط یک هنرمند انسانی است؛ البته نه لزوماً مبتکرانه یا از نظر موسیقی منسجم تر از آن.
قابلیتهای MusicLM فراتر از تولید کلیپهای کوتاه آهنگ است. محققان گوگل نشان میدهند که این سیستم میتواند روی ملودیهای موجود، چه زمزمهشده، آواز، سوت یا نواختن یک ساز، ساخته شود.
MusicLM همچنین میتواند از طریق ترکیبی از تصویر و زیرنویس آموزش داده شود یا صدایی تولید کند که توسط یک نوع خاص از ساز در یک ژانر خاص پخش میشود. حتی سطح تجربه هوش مصنوعی گوگل را می توان تنظیم کرد و سیستم می تواند موسیقی الهام گرفته از مکان ها، دوره ها یا الزامات ایجاد کند (مثلاً موسیقی انگیزشی برای تمرین).
با این حال، محققان گوگل به چالشهای اخلاقی زیادی که توسط سیستمی مانند MusicLM ایجاد میشود، اشاره میکنند که یکی از آن ها تمایل به گنجاندن مطالب دارای حق چاپ از دادههای آموزشی در آهنگهای تولید شده است. آنها در طی آزمایش دریافتند که حدود 1درصد از موسیقیای که سیستم تولید میکند مستقیماً از آهنگهایی که روی آنها آموزش داده شده تکرار میشود؛ آستانهای که ظاهراً به اندازهای بالاست که آنها را از انتشار MusicLM در وضعیت فعلی آن منصرف کند.
به نظر میرسد با فرض اینکه MusicLM یا سیستمی مانند آن روزی در دسترس قرار گیرد؛ مسائل حقوقی عمده مطرح شود حتی اگر این سیستم به عنوان ابزاری برای کمک به هنرمندان باشد.
در سال 2020، شرکت ضبط Jay-Z به دلیل استفاده از هوش مصنوعی برای ایجاد کاور آهنگ هایی مانند یک آهنگ مشهور از بیلی جوئل، علیه یک کانال یوتیوب، شکایت کرد.
موسیقی تولید شده توسط هوش مصنوعی سابقه ای طولانی دارد که به چندین دهه قبل باز می گردد. یکی از نسخههای اخیر از موتور تولید تصویر با هوش مصنوعی StableDiffusion برای تبدیل پیامهای متنی به طیفنگاری استفاده میکند که این اینکار در نهایت به موسیقی تبدیل میشود. MusicLM میتواند از نظر کیفیت و پایبندی به عنوان و همچنین این واقعیت که میتواند صدا را دریافت و ملودی را کپی کند، از سایر سیستمها بهتر عمل خواهد کرد.
شفافیت در مورد این سیستم باید به زودی انجام شود، احتمالا چندین پرونده قضایی که به دادگاه راه می یابند بر هوش مصنوعی تولید کننده موسیقی تأثیر خواهد داشت؛ از جمله حقوق هنرمندانی است که بدون اطلاع یا رضایت آنها برای آموزش سیستم های هوش مصنوعی استفاده می شود.
ادامه
آذر ۲, ۱۴۰۳