人工智能AI系列 - java SDK - webrtc语音活动检测(Voice Activity Detection,VAD)

webrtc语音活动检测(Voice Activity Detection,VAD)

语音活动检测(Voice Activity Detection,VAD)又称语音端点检测,语音边界检测。目的是从声音信号流里识别和消除长时间的静音期, 静音抑制可以节省宝贵的带宽资源,可以有利于减少用户感觉到的端到端的时延。
VAD引擎需要8、16、32或48 KHz的采样率的单声道、16位PCM音频作为输入。输入应该是10、20或30毫秒的音频片段。当音频输入为16 KHz时,输入数组的长度应为160、320或480。
语音活动检测可以运行在4种不同的模式。模式范围从0到3。模式0非常严格,这意味着当VAD预测为语音时,音频片段是语音的概率更高。模式3非常激进,这意味着当VAD预测为语音时,音频是语音的概率较低。如预期的那样,模式1和2逐渐降低了这种概率。

帮助
共享库文件:
  • linux: lib/linux
  • -libfvad.so
  • -libwebrtcvadwrapper.so
  • windows: lib/windows
  • -libfvad.dll
  • -libwebrtcvadwrapper.dll
linux/mac 设置环境变量
  • 共享库文件需添加到 java.library.path
    LD_LIBRARY_PATH to /path/to/shared/libraries:$LD_LIBRARY_PATH.
windows 设置环境变量
  • 共享库文件需添加到 PATH
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值