语音情感识别常见的声学特征

最新推荐文章于 2024-08-04 16:56:18 发布

m0_37854651

最新推荐文章于 2024-08-04 16:56:18 发布

阅读量2.6k

点赞数 1

文章标签：语音识别模式识别

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_37854651/article/details/107403167

版权

1.韵律特征

基于基音频率的特征，包含Jitter，基音频率的包络，基音频率的线性预测系数。
共振峰特征，包含一阶共振峰，二阶共振峰，以及共振峰的带宽等。
基于能量的特征，包含 shimmer，4 阶Legendre 参数等。
时间特征，包含说话部分和不说话部分的比值，最长说话的时间等。
发音清晰程度的特征。
声音级别：信号幅度，能量被证明与声音级别有很大的关系。
短语，音素，单词以及这些特征的边界。
时间结构。

2.谱特征

短时连贯性(Short Time Coherence，SMC)
过零幅度峰值(Zeros Crossing Peak Amplitude，ZCPA)
线性预测倒谱系数(Linear Predictor Cepstral Coefficients，LPCC)
LPC MFCC LSP PLP ，RASTA 感知线性预测倒谱系数(RASTA-PLP)
最小二乘改进Yule-Walker 方程(Least Squares Modified Yule-Walker Equations，LSMYWE)
单边自相关线性预测系数(One-sided Autocorrelation Linear PredictorCoefficients，OSALPC)
单边自相关线性预测倒谱系数(One-side Autocorrelation Linear Predictor Cepstral Coefficients，OSALPCC)

3.其他特征

根据发音系统提出的基于Teager 能量算子(Teager Energy Operator，TEO)的语音特征。
根据语音属于一种非平稳的信号原理，提出的基于经验模态分解(Empirical Mode Decomposition，EMD)的语音特征。
根据语音信号的混沌程度在缓和的情绪中比较小，在激烈的情绪中比较大的原理，基于分形维(Fractal Dimension)的语音特征。
另外基于深度学习的语音特征在语音信号处理中的作用越来越大。

关注

1
点赞
踩
17

收藏

觉得还不错? 一键收藏
0
评论
语音情感识别常见的声学特征

1.韵律特征基于基音频率的特征，包含Jitter，基音频率的包络，基音频率的线性预测系数。共振峰特征，包含一阶共振峰，二阶共振峰，以及共振峰的带宽等。基于能量的特征，包含 shimmer，4 阶Legendre 参数等。时间特征，包含说话部分和不说话部分的比值，最长说话的时间等。发音清晰程度的特征。声音级别：信号幅度，能量被证明与声音级别有很大的关系。短语，音素，单词以及这些特征的边界。时间结构。2.谱特征短时连贯性(Short Time Coheren...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。