
Seperti peralatan GenAI mulai mengubah industri muzik dengan cara yang luar biasa — dan dalam beberapa kes lebih menyebabkan masalah etika — Google sedang meningkatkan investasinya dalam teknologi AI untuk menciptakan lagu dan lirik baru.
Hari ini, raksasa pencarian tersebut meluncurkan MusicFX, sebuah upgrade dari MusicLM, alat pembuat musik yang dirilis Google tahun lalu. MusicFX dapat menciptakan lagu-lagu hingga 70 detik dan loop musik, memberikan apa yang diklaim Google sebagai penciptaan musik yang “berkualitas lebih tinggi” dan “lebih cepat”.
MusicFX tersedia di Google’s AI Test Kitchen, sebuah aplikasi yang memungkinkan pengguna mencoba sistem AI percobaan dari laboratorium perusahaan. Secara teknis, MusicFX diluncurkan untuk pengguna terpilih pada bulan Desember — tetapi sekarang sudah tersedia secara umum.

Dan tidak buruk, saya harus katakan.
Seperti pendahulunya, MusicFX memungkinkan pengguna memasukkan rangsangan teks (“dua gitar tali nilon bermain dalam gaya flamenco”) untuk mendeskripsikan lagu yang ingin mereka ciptakan. Alat ini menghasilkan dua versi 30 detik secara default, dengan opsi untuk memperpanjang trek (hingga 50 atau 70 detik) atau otomatis menjahit awal dan akhirnya untuk membuat loop.
Penambahan baru adalah saran kata deskriptor alternatif dalam rangsangan. Misalnya, jika Anda mengetik “gaya country,” Anda mungkin melihat daftar turun dengan genre seperti “gaya rockabilly” dan “gaya bluegrass.” Untuk kata “menarik,” daftar turun mungkin berisi “chill” dan “melodis”.

Dibawah bidang rangsangan, MusicFX menyediakan awan kata-kata rekomendasi tambahan untuk deskripsi relevan, alat musik dan tempo yang akan ditambahkan (misalnya “avant garde,” “cepat,” “mendebarkan,” “drum 808”).
Jadi, bagaimana rasanya? Nah, dalam pengujian singkat saya, sampel MusicFX lumayan? Sejujurnya, alat generasi musik sudah sampai pada titik di mana sulit bagi penulis ini untuk membedakan antara hasil keluaran. Keadaan seni terkini menghasilkan trek yang terdengar bersih, jernih — tetapi juga terdengar membosankan, tidak terinspirasi, dan melankolis.
Mungkin itu akibat SAD yang sedang saya alami, tetapi salah satu rangsangan yang saya gunakan adalah “lagu musik house dengan beat funky yang mudah didansa dan membangkitkan semangat, dengan suasana atap di musim panas.” MusicFX memberikan, dan trek tersebut tidak buruk — tetapi saya tidak dapat mengatakan bahwa mereka mendekati set DJ terbaik yang pernah saya dengar belakangan ini.
Dengarkan sendiri:
Segala sesuatu dengan alat musik berdawai terdengar lebih buruk, seperti sampel MIDI murah — yang mungkin merupakan cermin dari jumlah latihan terbatas MusicFX. Berikut dua trek yang dihasilkan dengan rangsangan “melodi yang penuh soul dimainkan dengan alat musik berdawai, orkestra, dengan inti melodi yang kuat”:
Dan untuk sedikit perubahan, berikut adalah interpretasi MusicFX dari “sebuah lagu sedih dengan gitar, melankolis, tempo lambat, pada malam bulan purnama.” (Maafkan kesalahan ejaan.)
Terdapat hal-hal tertentu yang MusicFX tidak akan menghasilkan — dan hal tersebut tidak dapat dihapus dari trek yang dihasilkan. Untuk menghindari melanggar hak cipta, Google menyaring rangsangan yang menyebutkan artis tertentu atau termasuk vokal. Dan perusahaan menggunakan SynthID, teknologi watermarked yang tidak terdengar yang dikembangkan oleh divisi DeepMind-nya, untuk menunjukkan dengan jelas lagu-lagu mana yang berasal dari MusicFX.
Saya tidak yakin daftar master apa yang digunakan oleh Google untuk menyaring artis dan nama lagu, tetapi saya tidak mendapati hal tersebut terlalu sulit untuk dikalahkan. Sementara MusicFX menolak untuk menghasilkan lagu dalam gaya SZA dan The Beatles, alat tersebut dengan senang hati menerima rangsangan yang mengacu pada Lake Street Dive — meskipun trek-trek tersebut tidak terlalu mencolok, saya harus katakan.
Generasi lirik
Google merilis alat generasi lirik baru, TextFX, di AI Test Kitchen yang dimaksudkan sebagai semacam pendamping untuk MusicFX. Seperti MusicFX, TextFX telah tersedia untuk kelompok pengguna kecil sejak beberapa waktu — tetapi kini lebih luas ketersediaannya, dan ditingkatkan dari segi “pengalaman pengguna dan navigasi,” kata Google.
Sebagaimana dijelaskan oleh Google dalam aplikasi AI Test Kitchen, TextFX dibuat bekerja sama dengan Lupe Fiasco, artis rap dan produser rekaman. Alat ini didukung oleh PaLM 2, salah satu model AI teks dari Google, dan “[mencurahkan] inspirasi dari teknik-teknik lyrical dan linguistik yang [Fiasco] kembangkan sepanjang kariernya.”

Reporter ini mengharapkan TextFX untuk menjadi alat pembuat lirik yang lebih kurang otomatis. Tetapi ternyata tidak. Sebaliknya, TextFX adalah sekelompok modul yang dirancang untuk membantu dalam proses penulisan lirik, termasuk modul yang menemukan kata-kata dalam kategori yang diawali dengan huruf yang dipilih dan modul yang menemukan kemiripan antara dua hal yang tidak terkait.

TextFX membutuhkan waktu untuk menguasainya. Tetapi saya melihat ini bisa menjadi sumber daya yang berguna bagi penulis lirik — dan penulis secara umum, sejujurnya.
Anda akan ingin meninjau keluaran-keluarannya dengan seksama. Google memperingatkan bahwa TextFX “dapat menampilkan informasi yang tidak akurat, termasuk tentang orang,” dan saya memang berhasil membuatnya menyarankan bahwa perubahan iklim “adalah sebuah kebohongan yang dilakukan oleh pemerintah Tiongkok untuk merugikan bisnis-bisnis Amerika.” Yaiks.

Masih ada pertanyaan
Dengan MusicFX dan TextFX, Google menunjukkan bahwa mereka sangat berinvestasi dalam teknologi musik GenAI. Tetapi saya bertanya-tanya apakah kekhawatiran mereka untuk tetap selaras dengan tren daripada mengatasi pertanyaan-pertanyaan sulit seputar musik GenAI akan membantu mereka pada akhirnya.
Secara bertahap, trek-trek buatan sendiri yang menggunakan GenAI untuk membangkitkan suara dan vokal yang akrab dan dapat dianggap otentik, atau setidaknya cukup mendekati, telah menjadi viral. Label musik telah cepat dalam menandai trek-trek yang dihasilkan AI kepada mitra streaming seperti Spotify dan SoundCloud, dengan membicarakan masalah kekayaan intelektual. Mereka umumnya berhasil. Namun, masih ada ketidakjelasan apakah musik “deepfake” melanggar hak cipta dari artis, label, dan pemegang hak lainnya.
Hakim federal memutuskan pada Agustus bahwa seni yang dihasilkan AI tidak dapat dilindungi hak cipta. Namun, Kantor Hak Cipta AS belum mengambil sikap, baru-baru ini mulai mencari masukan publik mengenai masalah hak cipta sebagaimana berkaitan dengan AI. Juga belum jelas apakah pengguna bisa terjerat pelanggaran hukum hak cipta jika mereka mencoba mengkomersialisasikan musik yang dihasilkan dalam gaya artis lain.
Google sedang mencoba menjalani jalan dengan hati-hati menuju penyebaran alat-alat musik GenAI di sisi YouTube bisnisnya, yang sedang menguji model AI yang dibuat oleh DeepMind bekerja sama dengan artis seperti Alec Benjamin, Charlie Puth, Charli XCX, Demi Lovato, John Legend, Sia, dan T-Pain. Itu lebih dari yang dapat dikatakan dari beberapa pesaing GenAI-nya, seperti Stability AI, yang berpendapat bahwa “penggunaan wajar” membenarkan pelatihan pada konten tanpa izin pencipta.
Tetapi dengan label-label menggugat vendor-vendor GenAI atas lirik berhak cipta dalam data pelatihan dan artis-artis mendaftarkan ketidakpuasan mereka, Google memiliki tugas berat di depannya — dan mereka tidak membiarkan fakta yang merepotkan tersebut melambatkan langkah mereka.