c语言实现语音检测vad_AI大语音(二)——语音预处理

点击上方“AI大道理”,选择“置顶”公众号

重磅干货,细致入微AI大道理

 ——————

1 预滤波

0936e7f4e40833def455ea548eed2f03.png

    CODEC说得通俗一点,对于音频就是A/D和D/A转换。前端带宽为300-3400Hz(语音能量主要集中在250~4500Hz)的抗混叠滤波器。

工程测量中采样频率不可能无限高也不需要无限高,因为一般只关心一定频率范围内的信号成份。为解决频率混叠,在对模拟信号进行离散化采集前,采用低通滤波器滤除高于1/2采样频率的频率成份。实际仪器设计中,这个低通滤波器的截止频率(fc) 为: 

  截止频率(fc)= 采样频率(fs) / 2.56

2 A/D转化 0936e7f4e40833def455ea548eed2f03.png

8kHz的采样频率,12bit的线性量化精度。

25c45efe6c464bc4bb1b4711da413955.png

一段3.5秒的语音,经过A/D转化后共28000个点的数据。

signal: [ -919 -1314 -1049 ...,   148   136   120]

1de9151253bb78b5ad6bd7efbeeda0f9.png

一帧25毫秒的语音,经过A/D转化后共200个点的数据。

73454af07a350595774328a479c4576f.png

3 预加重
  • 2
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值