语音算法笔记（4）——语音识别前沿课题

最新推荐文章于 2024-04-28 19:30:27 发布

韬光养晦气

最新推荐文章于 2024-04-28 19:30:27 发布

阅读量1k

点赞数

分类专栏：语音识别算法学习文章标签：远场语音识别 mix-lingual

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_37805505/article/details/107585147

版权

声明：本专栏文章为深蓝学院《语音算法：前沿与应用》课程个人学习笔记，更多学习资源请咨询深蓝学院相关课程。

远场语音识别

siri（2011）：近场语音识别

echo（亚马逊，2014）：远场语音识别

当说话人和麦克风相离3-5米时，可以认为是远场语音识别。

困难：1.背景噪声 2.扬声器音乐干扰 3.麦克风灵敏度 4.墙面折射声波 5.声波漫射

解决方法：

1.数据增强——加混响（卷积）、加噪声（时域叠加，调节噪声能量，控制信噪比）、音量扰动（训练数据音量随机放大或缩小）、速度扰动（改变速度tempo参数、音调speed参数）、时域mask、频域mask，可参考ASplRE竞赛

2.做信号处理，提高输入音频的质量——AEC（设备知道播放的是什么音乐，可以把音乐减掉）、AGC(测试数据的音量归一化)、BF（多路麦克风的情况）、NS（提高信噪比方式）

AEC：

AEC技术问题：时间延迟估计（声源和扬声器位置不同）、双讲模块、回声残留， etc

AGC：

最低0.47元/天解锁文章

韬光养晦气

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
语音算法笔记（4）——语音识别前沿课题

声明：本专栏文章为深蓝学院《语音算法：前沿与应用》课程个人学习笔记，更多学习资源请咨询深蓝学院相关课程。远场语音识别siri（2011）：近场语音识别echo（亚马逊，2014）：远场语音识别当说话人和麦克风相离3-5米时，可以认为是远场语音识别。困难：1.背景噪声 2.扬声器音乐干扰 3.麦克风灵敏度 4.墙面折射声波 5.声波漫射解决方法：1.数据增强——加混响（卷积）、加噪声（时域叠加，调节噪声能量，控制信噪比）、音量扰动（训练数据音量随机放大或缩小）、速度扰动（改变速度t
复制链接

扫一扫

专栏目录

韬光养晦气 CSDN认证博客专家 CSDN认证企业博客

码龄7年

30: 原创

14万+: 周排名

171万+: 总排名

8万+: 访问

: 等级

906: 积分

34: 粉丝

91: 获赞

19: 评论

270: 收藏

私信

关注

热门文章

分类专栏

最新评论

自步学习（Self-paced Learning）
ZIcsdn: 有没有谁交流一下自步学习。训练可不可能出现，预测结果越来越差，这样的话损失就越来越大，框架认为是难样本，反而赋予0权重，这些能够反向传播的损失就越来越小。我现在训练就遇到这样的问题，反向传播的损失为0，也就是说全认为是难样本了。
自步学习（Self-paced Learning）
缘茜行: 链接：https://www.isclab.org.cn/wp-content/uploads/2018/01/%e8%87%aa%e6%ad%a5%e5%ad%a6%e4%b9%a0-%e8%b5%b5%e6%83%9f%e8%82%96-2018-1-1-19_00_00.pdf
自步学习（Self-paced Learning）
缘茜行: 这篇文章图片和内容来源：北京理工大学信息系统及安全对抗实验中心赵惟肖硕士。如果是利用他人PPT，请不要写原创。尊重他人劳动成果。如果是本人，谢谢你的科普。
自步学习（Self-paced Learning）
qq_37622715: 很棒很清晰，感谢分享！
自步学习（Self-paced Learning）
qq_40276832: 请问算法最后的输出为什么没有v哦？这个算法的目的不就是为了确定选择哪些样本来供后续分类嘛？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。