kaldi
kaldi学习笔记
顶顶通-FreeSWITCH二次开发接口
这个作者很懒,什么都没留下…
展开
-
顶顶通VAD(支持噪音人声识别)二次开发接口发布拉
VAD语音活动检测(Voice Activity Detection,VAD)算法的难点是分析噪音还是人声,顶顶通公司经过1年的努力,基于20G的噪音声音文件和100G的正常人声的声音文件,使用tdnn(时延神经网络)和 lstm(长短期记忆网络)训练出噪音人声音判别模型。现在发布二次开发供大家测试。和FreeSWITCH集成的开源例子 再这里。原创 2023-02-27 12:17:17 · 479 阅读 · 0 评论 -
基于神经网络的VAD测试程序
语音活动检测(Voice Activity Detection,VAD),就是检测是否有声音,常规的算法是通过声音音量和频谱特诊来判断是否有声音的,但是无法区分是噪音还是人声,在电话机器人中噪音打断和噪音识别错误的关键词始终是一个痛点,机器学习算法可以通过大量噪音和人声数据训练出判别人声还是噪音的神经网络模型,VAD算法结合深度神经网络就可以彻底解决这个痛点了。原创 2023-02-09 14:57:10 · 657 阅读 · 0 评论