【深度学习】深度学习下的语音识别

人工智能大讲堂

已于 2023-11-10 12:36:51 修改

阅读量149

点赞数

分类专栏：深度学习机器学习文章标签：深度学习语音识别人工智能

于 2023-11-10 12:36:07 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41755306/article/details/134330279

版权

本文探讨了深度学习如何推动语音识别成为主流，详细解释了从声波数字化到预处理，再到使用循环神经网络进行字符预测的过程，以及语音识别系统面临的挑战和构建高质量系统所需的大量训练数据。

摘要由CSDN通过智能技术生成

语音识别正在侵入我们的生活。它内置于我们的手机、游戏机和智能手表中。它甚至使我们的房屋自动化。你只需 50 美元，你就可以获得一个 Amazon Echo Dot——一个神奇盒子，你只需大声说出你的需求就可以帮你订购披萨、获取天气预报甚至购买垃圾袋。
在这里插入图片描述

但是语音识别已经存在了几十年，那么为什么它现在才成为主流呢？原因是深度学习最终使语音识别足够准确，可以在精心控制的环境之外发挥作用。

Andrew Ng 早就预测，随着语音识别准确率从 95% 提高到 99%，它将成为我们与计算机交互的主要方式。这个想法是，这 4% 的准确率差距是令人讨厌的不可靠和非常有用之间的区别。感谢深度学习，我们终于达到了顶峰。

让我们学习如何使用深度学习进行语音识别！

机器学习并不总是一个黑匣子

如果您知道神经机器翻译的工作原理，您可能会猜到我们可以简单地将录音输入神经网络并训练它生成文本：
在这里插入图片描述

最大的问题是语音速度不同。一个人可能会说“hello！” 很快，另一个人可能会说“heeeelllllllllllllooooo！” 非常缓慢，产生一个包含更多数据的更长的声音文件。两个声音文件都应该被识别为完全相同的文本——“hello！” 事实证明，将各种长度的音频文件自动对齐到一段固定长度的文本非常困难。

为了解决这个问题，除了深度神经网络之外，我们还必须使用一些特殊的技巧和额外的进动。让我们看看它是如何工作的！

把声音变成比特流

语音识别的第一步很明显——我们需要将声波输入计算机。

在前面的学习中，我们学习了如何拍摄图像并将其视为数字数组，以便我们可以直接输入神经网络进行图像识别：
在这里插入图片描述

但是声音是以波的形式传播的。我们如何将声波转化为数字？让我们用这段我说“hello”的声音片段：

最低0.47元/天解锁文章

人工智能大讲堂

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【深度学习】深度学习下的语音识别

机器翻译发展之路
复制链接

扫一扫

专栏目录

人工智能大讲堂 CSDN认证博客专家 CSDN认证企业博客

码龄6年

63: 原创

39万+: 周排名

3万+: 总排名

8万+: 访问

: 等级

726: 积分

156: 粉丝

74: 获赞

18: 评论

312: 收藏

私信

关注

热门文章

分类专栏

最新评论

AutoGluon：亚马逊自动机器学习工具，初学者的福音
易如既往、峰起云涌♚: 你好，它训练的这个模型如何打开呢，
VTK系列教程十一：MPR定位线
山城小码农: 解决了嘛？这个问题
VTK系列教程十一：MPR定位线
qq_47386565: 我也遇到了这样的问题是因为什么原因导致的有解决办法吗
VTK系列教程十一：MPR定位线
qq_47386565: 你好有后续吗求指点
分享人工智能方向优质技术博客
CSDN-Ada助手: 非常感谢您分享这些人工智能方向的优质技术博客，相信这些文章必将对广大读者有所帮助。同时，鼓励您也可以写一篇博客分享您在人工智能方向的学习心得和实践经验，或者深入探讨一个具体的人工智能技术，如人工智能图像识别、自然语言处理等，给大家带来更多的收获和启发。期待您的优秀作品！ 2023年博客之星「城市赛道」年中评选已开启（https://activity.csdn.net/creatActivity?id=10470&utm_source=blog_comment_city ），博主的原力值在所在城市已经名列前茅，持续创作就有机会成为所在城市的 TOP1 博主（https://bbs.csdn.net/forums/blogstar2023?typeId=3152981&utm_source=blog_comment_city），更有丰厚奖品等你来拿~。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。