声纹技术（二）：音频信号处理基础【模拟信号（连续）--采样--＞数字信号（离散）--量化--＞振幅简化为整数--编码--＞二进制序列】【WAV音频格式】【SoX】【分帧-加窗-】

u013250861

已于 2024-02-14 12:51:30 修改

阅读量1.8k

点赞数 1

分类专栏： Audio 文章标签：音视频语音识别人工智能

于 2022-06-24 21:29:50 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013250861/article/details/124523119

版权

Audio 专栏收录该内容

39 篇文章 33 订阅 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

2.1　欲懂声纹，先学音频

从学科分类上讲，声纹技术是语音信号处理的一个分支，而语音信号处理则属于音频信号处理这个大类。

语音信号和音频信号，这二者的区别在于：

语音信号专指人类说话时所发出的具有社会意义的声音，
音频信号则泛指人类能够听到的一切声音。例如乐器发出的声音，动物发出的声音，汽车发动机发出的声音，以及人们打鼾、打喷嚏、咳嗽时发出的声音，这些都属于广义上的音频信号，但它们并不属于语音信号，所以通常也不在声纹技术研究的范畴内。

音频信号处理中的许多基础概念与知识，对于学习声纹技术来说是至关重要的。

任何声纹系统，无论其中的模型多么先进，算法多么精妙，都离不开与声音打交道。只有接上了正确的音频信号，并从其中提取出了有意义的特征表示，后面的模型才能最大程度地发挥其作用。

所以本章，我们便专门系统地学习这些与声音相关的概念与知识。本章的覆盖面较为广泛，涉及人类的听觉感知、音频接口、编码技术、离散信号处理等诸多子领域。这些子领域乍看上去，似乎互相之间并没有太大关联。然而，当我们真正着手于声纹领域的研究或工程项目时，会发现所有这些子领域的知识都不可避免地会被用到。在企业或研究机构里，

了解本专栏

超级会员免费看

关注

1
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
声纹技术（二）：音频信号处理基础【模拟信号（连续）--采样--＞数字信号（离散）--量化--＞振幅简化为整数--编码--＞二进制序列】【WAV音频格式】【SoX】【分帧-加窗-】

在前面的章节里我们就提到过，从学科分类上讲，声纹技术是语音信号处理的一个分支，而语音信号处理则属于音频信号处理这个大类。语音信号和音频信号，这二者的区别在于，前者专指人类说话时所发出的具有社会意义的声音，而后者则泛指人类能够听到的一切声音。例如乐器发出的声音，动物发出的声音，汽车发动机发出的声音，以及人们打鼾、打喷嚏、咳嗽时发出的声音，这些都属于广义上的音频信号，但它们并不属于语音信号，所以通常也不在声纹技术研究的范畴内。音频信号处理中的许多基础概念与知识，对于学习声纹技术来说是至关重要的。任何声纹系统，无
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。