PEMISAHAN SUARA TERCAMPUR BERDASARKAN KARAKTERISTIK BINAURAL

Mifta Nur Farid

Abstract


Dalam suatu percakapan di pesta cocktail, seseorang mampu memfokuskan pendengarannya pada seorang lawan bicaranya meskipun bunyi musik latar cukup keras dan disertai percakapan beberapa orang lainnya. Fenomena ini dikenal dengan the cocktail party effect. Dalam sebuah studi awal dijelaskan bahwa binaural hearing memberikan kontribusi penting dalam efek tersebut. Penelitian tentang pemisahan suara yang berdasarkan pada lokalisasi bunyi telah dilakukan sebelumnya. Pada penelitian tersebut, pemisahan suara tercampur hanya berdasarkan binaural cue - interaural time difference. Maka pada penelitian ini, akan dilakukan pemisahan suara dari input binaural dengan 2 sensor mikrofon dari dua sumber suara berdasarkan kedua binaural cue tersebut yaitu interaural time difference (ITD) dan interaural level difference (ILD) menggunakan binary mask. Untuk mengestimasi nilai ITD, digunakan metode cross-correlation yang nilai ITD direpresentasikan sebagai nilai time delay pada pergeseran peak pada unit time-frequency. Binary mask diestimasi berdasarkan pola perubahan nilai interaural time difference dan interaural level difference terhadap nilai relative strength dari sinyal target yang dihitung secara statistik menggunakan probability density estimation. Hasil pemisahan sumber suara tercampur menunjukkan performa yang baik dengan SNR sebesar 3 dB.


Keywords


cocktail-party; binaural hearing; ITD; ILD; percent correct word, SNR.

Full Text:

PDF


DOI: https://doi.org/10.32487/jtt.v7i2.734

Refbacks

  • There are currently no refbacks.


JTT (Jurnal Teknologi Terpadu) has been indexed by:

 

 

 

 

 

 

 

 

 

Web
Analytics

JTT Visitor Stats