Apa Vad dalam Pengenalan Pidato?
6.1. Perkenalan. Deteksi Aktivitas Suara (VAD) adalah teknik di mana ada atau tidak adanya ucapan manusia terdeteksi. Deteksi dapat digunakan untuk memicu suatu proses. VAD telah diterapkan dalam aplikasi dan perangkat yang dikendalikan oleh pidato seperti smartphone, yang dapat dioperasikan dengan menggunakan perintah ucapan.
Bagaimana cara kerja WEBRTC VAD?
WebRTC membagi audio menjadi bingkai, setiap bingkai memiliki nomor yang sesuai (0 atau 1). Kami menggunakan frame 30ms untuk WebRTC, jadi setiap potongan 250 ms dibagi menjadi 8 frame, nilainya rata -rata digunakan sebagai treshold untuk plot.