- Mengapa kita menggunakan DCT di MFCC?
- Apa ekstrak mfcc?
- Apa output MFCC?
- Bagaimana MFCC digunakan dalam pengenalan ucapan?
Mengapa kita menggunakan DCT di MFCC?
DCT adalah langkah terakhir dari proses utama ekstraksi fitur MFCC. Konsep dasar DCT adalah menghubungkan nilai spektrum Mel sehingga menghasilkan representasi yang baik dari spektral properti lokal. Pada dasarnya konsep DCT sama dengan transformasi Fourier terbalik.
Apa ekstrak mfcc?
Teknik ekstraksi fitur MFCC pada dasarnya mencakup jendela sinyal, menerapkan DFT, mengambil log sebesar.
Apa output MFCC?
Output setelah menerapkan MFCC adalah matriks yang memiliki vektor fitur yang diekstraksi dari semua bingkai. Dalam matriks output ini, baris mewakili bingkai yang sesuai dan kolom mewakili koefisien vektor fitur yang sesuai [1-4]. Akhirnya matriks output ini digunakan untuk proses klasifikasi.
Bagaimana MFCC digunakan dalam pengenalan ucapan?
MFCC adalah fitur populer yang diekstraksi dari sinyal ucapan untuk digunakan dalam tugas pengakuan. Dalam model pembicaraan sumber-filter, MFCC dipahami untuk mewakili filter (saluran vokal). Respons frekuensi saluran vokal relatif halus, sedangkan sumber ucapan suara dapat dimodelkan sebagai kereta impuls.