Kecerdasan Buatan Yang Mengenali Lagu – Di abad ke-21, kecerdasan buatan bukan lagi hal yang baru. Perusahaan-perusahaan terutama di bidang teknologi informasi berlomba-lomba memperkenalkan produk yang memanfaatkan kecerdasan buatan untuk meningkatkan kenyamanan pelanggan.
Kecerdasan Buatan Yang Mengenali Lagu
tbadl – Kecerdasan buatan tidak dapat dipisahkan dari seni, termasuk musik. Mulai dari aplikasi yang mengenali musik/lagu yang sedang diputar, hingga kemampuan mengarang lagu.
Ada banyak aplikasi yang bisa mengenali musik di smartphone Anda, antara lain Shazam, SoundHound, TrackID Sony, dan Musixmatch. Bahkan, saat Google meluncurkan smartphone Google Pixel 2, ia juga memperkenalkan fitur Now Playing yang memungkinkannya mendeteksi musik yang diputar meski tanpa koneksi internet.
Baca Jugaa : Lagu Indonesia Dengan Perkembangan Teknologi
Fungsionalitas aplikasi ini sangat baik. Hanya dengan menggunakan sebagian lagu yang diputar, aplikasi dapat mengetahui judul lagu dengan mencari kecocokan di antara jutaan lagu di database-nya. Tampaknya rumit untuk menemukan lagu yang cocok dengan cepat dari database yang begitu besar. Tentu saja, jika metode pencariannya masih tradisional, yaitu mencocokkan lagu-lagu yang diputar satu per satu dengan lagu-lagu yang ada di database, ini akan menjadi tugas yang sangat kompleks dan tidak efisien, baik dari segi kompleksitas ruang dan waktu. Cara kerja aplikasi ini berbeda-beda dan didasarkan pada cara otak manusia mendeteksi suara. Sebuah penelitian yang dilakukan oleh Manchester Museum of Industry and Science menggunakan game online bernama Hooked On Music untuk menguji kemampuan 12.000 peserta dalam mengenali lagu.[1] Hasilnya, “Wannabe” milik Uchuu Girls menempati posisi pertama sebagai lagu bersertifikat tercepat dengan waktu rata-rata 2,3 detik.
Penelitian ini membuktikan bahwa otak manusia dilatih untuk mengenali suara yang didengarnya. Otak kita, seperti komputer biasa, tidak mengasosiasikan suara yang kita dengar dengan semua suara yang pernah kita dengar sebelumnya. Kombinasi suara dan variasinya mengaktifkan bagian tertentu dari neuron di otak yang mengingat suara yang didengar.
Baca Jugaa : Pelajari Tentang Peran Teknologi Dalam Industri Pariwisata Indonesia
Tentu saja, sebelum Anda dapat mengajari komputer Anda sebuah lagu, Anda harus mengonversinya terlebih dahulu ke format digital. Salah satu pilihannya adalah mengubah suara menjadi spektogram, representasi visual.
Sayangnya, karena data yang disimpan dalam spektogram terlalu besar, jumlah komputasi yang diperlukan sangat besar dan memerlukan banyak waktu. Untuk mengurangi daya komputasi yang diperlukan, Anda perlu memproses lebih sedikit data. Misalnya, Shazam telah mengembangkan versi representasi datanya sendiri yang disebut sidik jari. Sidik jari lagu Shazam menyimpan frekuensi terkuat pada saat itu, sehingga setiap lagu memiliki data yang sangat minim dalam database jutaan lagu yang disimpannya. Untuk mengenali lagu yang sedang diputar, Shazam mengubah suara yang berasal dari mikrofon Anda menjadi sidik jari dan membandingkannya dengan database yang ada.
Di sinilah hal menjadi menarik. Shazam menggunakan teknologi pelapisan, di mana sidik jari yang dikirim oleh ponsel cerdas Anda pertama-tama ditetapkan ke sejumlah kecil lagu terpopuler, lalu ke grup yang lebih besar. Dengan cara ini Shazam berhasil mempersingkat waktu yang dibutuhkan untuk mencari lagu yang kurang populer, namun Anda tetap bisa mencari lagu yang kurang populer.
Sistem berlapis ini menimbulkan pertanyaan baru: berapa banyak lapisan yang harus dibuat untuk mencapai hasil yang lebih optimal? Berapa banyak lagu yang harus disimpan di setiap level? Dan pada titik dan tahap apa kita harus membuat kueri?
Untuk mencapai hasil yang optimal, Shazam menggunakan algoritma genetika, sebuah metode kecerdasan buatan. GA dimulai dengan individu acak, yang kemudian dipilih untuk “disilangkan” guna menciptakan generasi individu baru. Dalam setiap generasi, individu-individu terbaik dipilih dan “dikembangbiakkan” kembali. GA generasi pertama tidak memberikan hasil yang baik. Shazam terus melakukan “mutasi dan hibridisasi” ini hingga menemukan individu dengan kinerja terbaik. Hasilnya adalah talent yang memiliki performa bagus dan bisa mengenali lagu dengan kecepatan minimal.