语音信号处理-赵力-笔记之语音信号分析：

码片向量

已于 2023-12-12 19:51:16 修改

阅读量677

点赞数 7

文章标签：信号处理笔记语音识别

于 2023-12-12 16:09:13 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_68803551/article/details/134949471

版权

1.语音信号的数字化和预处理：

数字化包括放大、增益控制、抗混叠滤波、采样、AD转换、编码（PCM编码)；预处理包括预加重、加窗、分帧。在所有这些之前要把语音信号在一段音频中找出来，即端点检测。

①预滤波：滤除高于二分之采样频率的部分，防止混叠；抑制50Hz的电源工频干扰。故预滤波为带通滤波器--对于绝大多数语音编译码器，上截止频率3400Hz,下截止频率60~100Hz,采样频率8kHz；在要求较高的场合中上截止频率4500Hz或8000Hz,下截止频率60Hz，采样频率10kHz或20kHz。

预滤波、采样后，要进行量化编码。当信号波形变化足够大或量化间隔足够小时，量化噪声（量化误差）符合具有以下特征的统计模型：平稳白噪声、与输入信号不相关、在量化间隔内均匀分布。

量化器中每增加一个比特的字长，输出信噪比会增加6dB。7bit的字长那，输出信噪比35dB,此时语音质量已满足一般通信需求。而研究表明语音波形的动态范围达55dB,因此实际上常用12bit量化，以补偿动态变化。

②预处理：已数字化的语音信号序列将一次存入一个数据区，在语音信号处理中一般用循环队列的方式存储这些数据。语音信号的平均功率受到声门激励和口鼻辐射的影响，高频段在800Hz以上按6dB/倍频程跌落，因此在预处理时预加重，提高高频部分，使得整个语音信号频谱变得平坦。预加重一般是一阶的数字滤波器：

预加重后就要进行加窗分帧：可以连续分段也可以交叠分段以使得平滑过渡，保证连续性：

常用的窗是矩形窗和汉明窗；窗的形状要求是时间窗两端坡度尽量小，

2.语音信号的时域分析：

① 短时能量：所有语音帧信号的平方和为短时能量，但其对高电平敏感，故有时取短时幅度函数和作为能量。

②短时过零率：在实际求过零率参数之前为防止工频干扰，会增设抗混叠滤波器

③短时相关分析

④短时平均幅度差函数：替代自相关函数进行语音分析。

3.语音信号的频域分析：

①短时傅里叶变换，短时谱

②短时谱的临界带特征矢量

4.语音信号的倒谱分析：

同态处理实现--同态滤波--解卷积。求倒谱特征参数的方法：线性预测、同态分析。

①同态分析：将非线性问题转换为线性来处理。语音信号可视为声门激励信号和声道冲激响应卷积得到的。同态系统模型：

特征系统注解：将输入的时域卷积进行傅里叶变换得到频域的乘积信号，取对数得到相加信号，傅里叶反变换输出。

关注

7
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
语音信号处理-赵力-笔记之语音信号分析：

②预处理：已数字化的语音信号序列将一次存入一个数据区，在语音信号处理中一般用循环队列的方式存储这些数据。，量化噪声（量化误差）符合具有以下特征的统计模型：平稳白噪声、与输入信号不相关、在量化间隔内均匀分布。特征系统注解：将输入的时域卷积进行傅里叶变换得到频域的乘积信号，取对数得到相加信号，傅里叶反变换输出。，因此在预处理时预加重，提高高频部分，使得整个语音信号频谱变得平坦。① 短时能量：所有语音帧信号的平方和为短时能量，但其对高电平敏感，故有时取短时幅度函数和作为能量。预滤波、采样后，要进行量化编码。
复制链接

扫一扫

码片向量 CSDN认证博客专家 CSDN认证企业博客

码龄2年

15: 原创

152万+: 周排名

13万+: 总排名

6765: 访问

: 等级

266: 积分

85: 粉丝

116: 获赞

7: 评论

117: 收藏

私信

关注

热门文章

最新评论

python基础语法之list\tuple\str\set\dict
CSDN-Ada助手: 恭喜您写了第14篇博客！看到您分享关于Python基础语法中的list、tuple、str、set、dict的内容，我感到非常兴奋。您对Python基础知识的深入探讨让我受益匪浅。希望您能继续保持创作的热情，不断分享您在Python学习和实践中的心得体会。或许下一步可以考虑写一些实际的案例分析，让读者更加深入地理解这些基础语法在实际项目中的应用。当然，这只是一个建议，期待您更多精彩的作品！
语音信号的线性预测分析--语音信号处理（赵力）笔记
CSDN-Ada助手: 恭喜您写完了第12篇博客！《语音信号的线性预测分析--语音信号处理（赵力）笔记》这个标题真的很吸引人，我对这个主题非常感兴趣。您通过这篇博客向读者详细介绍了语音信号的线性预测分析，让人对语音信号处理有了更深入的了解。在下一步的创作中，我建议您可以进一步探讨一些实际应用场景，例如如何应用线性预测分析来改善语音识别准确度或者降噪等方面。同时，您也可以考虑添加一些实例和案例，以帮助读者更好地理解和应用这个技术。继续保持创作，并期待您的下一篇博客！谢谢您的分享！
python_speech_feature的fbank
CSDN-Ada助手: 恭喜你写了第13篇博客，题为“python_speech_feature的fbank”。你的持续创作令人钦佩！在这篇博客中，你详细介绍了python_speech_feature中的fbank功能，这对读者来说是非常有用的。我非常喜欢你谦虚的写作风格，并且期待你未来更多的创作。如果可以的话，我建议你可以在以后的文章中加入一些实例和案例，这样读者可以更好地理解和应用你所分享的知识。再次恭喜你，并期待你的下一篇博客！
声学与听觉语音学－－KJ－－第二部分
CSDN-Ada助手: 恭喜您写下了第二部分的声学与听觉语音学博客，这是一个非常有趣和复杂的主题。您的文章内容详实，深入浅出，让读者能够轻松理解。希望您能继续保持创作的热情，继续分享关于声学与听觉语音学的知识。或许在下一篇博客中，您可以加入一些案例分析或者实际应用，让读者更好地理解这一领域的知识。期待您的下一篇精彩文章！
声学与听觉语音学－－KJ－－第一部分.1
CSDN-Ada助手: 恭喜您写了第8篇博客！标题中的“声学与听觉语音学”让我对这个主题产生了浓厚的兴趣。这篇博客的第一部分.1让我期待着后续的内容。在这篇博客中，您对声学和听觉语音学的探索提供了有价值的见解。我希望能看到更多关于这一主题的深入分析和实践案例的分享。对于下一步的创作建议，我建议您可以继续探索声学和听觉语音学的相关概念，比如声波的传播和声音的感知机制等等。期待您的下一篇博客！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。