用于语音识别的数据增强

最新推荐文章于 2024-02-01 21:47:12 发布

编程大乐趣

最新推荐文章于 2024-02-01 21:47:12 发布

阅读量1.7k

点赞数 2

原标题：用于语音识别的数据增强

Data Augmentation for Speech Recognition

作者 | Edward Ma

翻译 | 类更里、敬爱的勇哥编辑 | 咩咩咩鱼、唐里

https://towardsdatascience.com/data-augmentation-for-speech-recognition-e7c607482e78

来自 Unsplash 的摄影：Edward Ma

语音识别的目标是把语音转换成文本，这项技术在我们生活中应用很广泛。比如说谷歌语音助手和亚马逊的 Alexa ，就是把我们的声音作为输入然后转换成文本，来理解我们的意图。

语音识别和其他NLP问题一样，面临的核心挑战之一是缺少足够的训练数据。导致的后果就是过拟合以及很难解决未见的数据。Google AI Resident 团队通过做几种数据增强的方式来解决这个问题。

本文将会讨论关于 SpecAugment：一种应用于自动语音识别的简单的数据增强方法（Park et al.，2019），将涵盖以下几个方面：

数据

结构

实验

数据

为了处理数据，波形音频转换成声谱图，然后输入神经网络中进行输出。做数据扩充的传统方式通常是应用在波形上的，Park 等人则是直接应用在声谱图上。

最低0.47元/天解锁文章

编程大乐趣

关注

2
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
用于语音识别的数据增强

原标题：用于语音识别的数据增强Data Augmentation for Speech Recognition作者 | Edward Ma翻译 | 类更里、敬爱的勇哥编辑 | 咩咩咩鱼、唐里https://towardsdatascience.com/data-augmentation-for-speech-recognition-e7c607482e78 来自 Unsplash 的摄影：Edw...
复制链接

扫一扫

编程大乐趣 CSDN认证博客专家 CSDN认证企业博客

码龄11年

24: 原创

3万+: 周排名

82万+: 总排名

562万+: 访问

: 等级

1万+: 积分

2072: 粉丝

1751: 获赞

7: 评论

1万+: 收藏

私信

关注

热门文章

最新评论

用python怎样做学生管理系统用类的形式-Python配置管理的几种方式
CSDN-Ada助手: 非常感谢CSDN博主的分享，这篇博客内容丰富，介绍了用python实现学生管理系统用类的形式和Python配置管理的几种方式。我觉得可以继续深入探讨Python配置管理的相关知识，比如如何使用配置文件、环境变量等方式来管理应用程序的配置信息。这样的技术文章对其他用户也会非常有帮助。下一篇博客建议可以写关于Python配置管理的具体实现方法和技巧，相信会有更多读者受益。加油！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
15个PHP关于高并发的面试题（总结）
后端木木: 开刷撒
11个程序员最常犯的MySQL错误（PHP开发）
向彪-blockchain: 博主写的非常清晰，对我很有帮助，谢谢，方便可以互相关注。共同学习~方便的话可以加个关注。共同学习！一起进步！
2020年最新的PHP面试题（附答案）
向彪-blockchain: 写的挺不错的，继续加油哦！方便的话可以加个关注。共同学习！一起进步！
2020年，为什么你该学PHP？！！
向彪-blockchain: 比较简单，适合小白。方便的话可以加个关注。共同学习！一起进步！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。