基于注意力机制的语音识别

最新推荐文章于 2023-12-27 01:45:56 发布

沧海一声笑·rush

最新推荐文章于 2023-12-27 01:45:56 发布

阅读量2.7k

点赞数 1

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhaozhao236/article/details/107732492

版权

研究背景

在表达不同的情绪的语音，在人耳能感到的特征方面，有明显的区别（如下图）
在这里插入图片描述

语音情绪识别的工具

传统的机器学习
深度学习

其中深度学习常见的是卷积神经网络和循环神经网络，前者适合应用于空间分布数据，后者更多的适合应用于时间性的分布数据。

由于情感的标签本身就具有一定的主观性，所以一般实验使用国际上广泛认证的两个最常用的数据集，都是由专业演员进行演绎，并有情感专家鉴别生成的数据集。

研究现状

语音情绪识主要有两个步骤组成：特征提取和分类

特征提取方面

人们从语音中发现了并提取了一组与情绪状态密切相关的特征，作者使用短时窗口滑动的方式，提取了一组 6373 个特征的特征集。后来 Eyben 等人提出了一个更加简洁而有效的数据集（GeMAPS），这个数据集由 62 个特征组成。

分类器方面

语音情绪识别借鉴于在语音识别中，广泛应用的隐马尔科夫模型（HMM）去拟合情感状态进行分类。

语音情绪识别，主要是在两个方向上

最低0.47元/天解锁文章

沧海一声笑·rush

关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

沧海一声笑·rush CSDN认证博客专家 CSDN认证企业博客

码龄5年

147: 原创

4万+: 周排名

106万+: 总排名

15万+: 访问

: 等级

2528: 积分

457: 粉丝

94: 获赞

64: 评论

532: 收藏

私信

关注

热门文章

分类专栏

.net core 22篇
408 4篇
算法 1篇
Go 18篇
Linux & docker 6篇
数据库 14篇
前端 32篇
代码工具 17篇
c# 15篇
计算机视觉 5篇
深度学习 12篇
问题 1篇

最新评论

在Google浏览器下载网页视频
lingaolei123: open in new tap在哪里呢，没找到呢，还有那个进度条很快也没找到呢
Go 入门の并发
沧海一声笑·rush: 原来如此，当时没注意
Vue实现复制excel表格内容粘贴至网页
沧海一声笑·rush: 上面展示需要的传参，如果不需要，可以忽略的。
Go 入门の并发
henry_oulen: 那个有bug那个代码这样改一下就好了，你那边没有关闭chan,用完以后需要进行关闭 [code=go] package main import ( "fmt" "sync" ) /* 启动一个 goroutine ，生成100 个数，发送到 ch1 启动一个 goroutien，从ch1 中取值，计算其平方，然后放到 ch2 中在 main 中，从 ch2 中取值 */ var wg sync.WaitGroup var a chan int var b chan int func f1(ch1 chan int) { defer wg.Done() for i := 0; i < 100; i++ { ch1 <- i } close(ch1) } func f2(ch1, ch2 chan int) { defer wg.Done() for x := range ch1 { ch2 <- x * x } close(ch2) } func main() { a = make(chan int, 100) b = make(chan int, 100) wg.Add(2) go f1(a) go f2(a, b) wg.Wait() for ret := range b { fmt.Println(ret) } } [/code]
基于语音的情绪识别系统（Python）
weixin_50642148: 请问你实现了吗

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。