Pengenalan Suara Jaringan Saraf

Dapatkah jaringan saraf digunakan untuk pengenalan ucapan?
Jaringan saraf mana yang terbaik untuk pengakuan ucapan?
Mengapa jaringan saraf digunakan untuk pengenalan ucapan?
Algoritma mana yang digunakan untuk pengenalan suara?

Dapatkah jaringan saraf digunakan untuk pengenalan ucapan?

Jaringan saraf sangat kuat untuk pengakuan berbicara. Ada berbagai jaringan untuk proses ini. RNN, LSTM, jaringan saraf dalam dan hibrida HMM-LSTM digunakan untuk pengenalan suara.

Jaringan saraf mana yang terbaik untuk pengakuan ucapan?

Convolutional Neural Network (CNN) diterapkan sebagai jaringan saraf dalam yang canggih untuk mengklasifikasikan setiap kata dari kumpulan data kami yang dikumpulkan sebagai tugas klasifikasi multi-kelas. Jaringan saraf dalam yang diusulkan mengembalikan 97.06% sebagai akurasi klasifikasi kata dengan sampel ucapan yang sama sekali tidak diketahui.

Mengapa jaringan saraf digunakan untuk pengenalan ucapan?

Jaringan saraf berkinerja sangat baik dalam mempelajari probabilitas fonem dari input audio yang sangat paralel, sedangkan model Markov dapat menggunakan probabilitas pengamatan fonem yang disediakan jaringan saraf untuk menghasilkan urutan fonem atau kata yang paling mungkin.

Algoritma mana yang digunakan untuk pengenalan suara?

Dalam salah satu karya [10], metode pra-pemrosesan bicara dipertimbangkan menggunakan algoritma VAD, yang membuktikan bahwa algoritma ini meningkatkan kinerja pengenalan suara.