语音情感计算理论基础

最新推荐文章于 2024-05-09 15:56:27 发布

flybirding10011

最新推荐文章于 2024-05-09 15:56:27 发布

阅读量394

点赞数

文章标签：数据结构与算法人工智能

原文链接：https://yq.aliyun.com/articles/691212

版权

1.语音情感计算中情感的建模方法有哪些？有什么区别？情感计算主要应用于哪些领域？

支持向量机（SVM）、隐马尔可夫模型（HMM）、人工神经网路（NN）等。
- SVM：基音+SVM算法=统计特征→识别语音状态；
- HMM：输入特征矢量序列+训练=统计信号→识别语音状态；
- NN：多层神经网路+训练=模拟人脑组织→识别语音状态。
虚拟人物、身份验证、智能用户界面、交互式感性图像检索、多功能机、语音识别、面部识别、军用可穿戴计算机等等。

2.列举三种以上的用于语音情感计算的声学特征，并解释其物理含义。

声学特征：

音色。发音体形状、质地、构造不同，决定了音色的不同。
音调。发音体声音频率的高低。
音强。发音体振动的幅度特征。
音长。发音体振动延续的时间特征。

语句特征：

基频。基音的频率，决定了音高。在不同情感状态说，说同一段话，基频是不同的。一般研究基频的峰值、均值、方差等特征。
低于250HZ的谱能量。根据parseval定理，信号傅氏变换模平方被称为谱能量。带有情绪的状态下谱能量和低于250HZ的谱能量时的存在一些规律。
语速。讲一个语句的速度。不同情绪下的语速有规律性差异。
能量。生气和高兴时能量高，其次平静，悲伤最低。

flybirding10011

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。