声纹技术(二):音频信号处理基础【模拟信号(连续)--采样-->数字信号(离散)--量化-->振幅简化为整数--编码-->二进制序列】【WAV音频格式】【SoX】【分帧-加窗-】

2.1 欲懂声纹,先学音频

从学科分类上讲,声纹技术是语音信号处理的一个分支,而语音信号处理则属于音频信号处理这个大类

语音信号音频信号,这二者的区别在于:

  • 语音信号专指人类说话时所发出的具有社会意义的声音,
  • 音频信号则泛指人类能够听到的一切声音。例如乐器发出的声音,动物发出的声音,汽车发动机发出的声音,以及人们打鼾、打喷嚏、咳嗽时发出的声音,这些都属于广义上的音频信号,但它们并不属于语音信号,所以通常也不在声纹技术研究的范畴内。

音频信号处理中的许多基础概念与知识,对于学习声纹技术来说是至关重要的。

任何声纹系统,无论其中的模型多么先进,算法多么精妙,都离不开与声音打交道。只有接上了正确的音频信号,并从其中提取出了有意义的特征表示,后面的模型才能最大程度地发挥其作用。

所以本章,我们便专门系统地学习这些与声音相关的概念与知识。本章的覆盖面较为广泛,涉及人类的听觉感知、音频接口、编码技术、离散信号处理等诸多子领域。这些子领域乍看上去,似乎互相之间并没有太大关联。然而,当我们真正着手于声纹领域的研究或工程项目时,会发现所有这些子领域的知识都不可避免地会被用到。在企业或研究机构里,

  • 1
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值