AI Bikin Ariana Grande Bisa Nyanyi 'Rungkad', Jungkook BTS Bawakan 'Janji Setia'

Senin 01-05-2023,13:14 WIB
Reporter : Gunawan Sutanto
Editor : Gunawan Sutanto

Trend penggunaan artificial intelligence (AI) meningkat dalam beberapa bulan terakhir. Termasuk dalam hal mesin pencarian, sensor kamera yang lebih canggih, hingga duplikasi suara.

Yang sedang ramai saat ini adalah suara para selebriti dunia tiba-tiba bisa direkayasa bisa menyanyikan lagu-lagu populer Indonesia.

Suara Jungkook BTS dan Ariana Grande misalnya. Suara Ariana Grande digunakan dalam lagu-lagu seperti Sial, Komang, Tak Segampang Itu, Rungkad dan Merasa Indah.

Sementara suara Jungkook BTS digunakan dalam lagu-lagu seperti Janji Setia dan Merasa Indah

Rupanya, suara mereka di-remake seniman lokal bernama @ianyxi menggunakan teknologi AI. Hebatnya, lagu-lagu tersebut memang seperti dinyanyikan oleh Jungkook BTS dan Ariana Grande. 

Lagu-lagu yang di-remake menggunakan suara keduanya mendapatkan atensi luar biasa dari warganet di lintas platform.

Banyak warganet memuji kemampuan @ianyxi dalam melakukan remake suara AI milik Ariana Grande dan Jungkook BTS. Tapi ada beberapa penggemar yang kecewa karena suara idola mereka dapat di-remake dengan sembarangan.

JBACA JUGA:Jungkook Hapus Seluruh Feed Instagram, Isyarat Comeback?

Tidak diketahui, dengan menggunakan software apa @ianyxi bisa melakukan remake itu. Namun saat ini ada salah satu teknologi AI yang dikenal dengan nama DiffSVC bisa menirukan suara manusia aslinya.

DiffSVC adalah singkatan Diffusion Singing Voice Conversion. Diffusion Singing Voice Conversion adalah model generatif yang digunakan untuk mengubah suara penyanyi dalam sebuah rekaman audio.

Teknologi ini dirancang untuk mengubah suara penyanyi sumber menjadi suara penyanyi sesuai target, dengan cara yang realistis dan dapat diandalkan.

DiffSVC menggunakan teknik Diffusion Probabilistic Models untuk melakukan konversi suara. Model ini bekerja dengan mempelajari distribusi probabilitas dari spektrogram audio dan menghasilkan spektrogram audio baru yang sesuai dengan distribusi tersebut.

Dalam hal ini, DiffSVC mempelajari distribusi probabilitas dari suara penyanyi sumber dan target, dan kemudian menghasilkan suara penyanyi target yang baru.

Selama ini DiffSVC digunakan dalam aplikasi pengolahan audio seperti produksi musik dan film, di mana seringkali perlu mengubah suara penyanyi agar sesuai dengan kebutuhan produksi.

Dengan menggunakan model ini, suara penyanyi target dapat dihasilkan dengan mudah dan cepat, mengurangi waktu dan biaya produksi.(*)

Kategori :