(一)vad
之前一直在git上找一些vad算法,但是一直没有找到简单易懂效果又好的,最近偶然发现了praat的vad方案有好用,所以准备把praat学习一下,并记录一下学习过程。
praat vad的使用方法非常简单,调参数也特别方便,就是批量操作这块可能需要自己写歌简单的praat脚本,操作过程如下:
step1 : 读取音频文件。
step2 : 选中音频-点击右侧Annotate-选择To Textured(silence)-
step3 : 这时候会出现一个调参数的界面,可以根据你要标注音频的文件的特性去调整。
step4 :调完参数后,点击ok,然后保存生成的textgrid文件就可以啦。(效果如下:语音段会标注成“sounding”,静默段标注为“silent”)