语音识别研究综述——阅读笔记4（总结与展望）

最新推荐文章于 2025-01-19 01:08:06 发布

我是小蔡呀～～～

最新推荐文章于 2025-01-19 01:08:06 发布

阅读量872

点赞数

分类专栏：文献阅读笔记文章标签：语音识别人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/overload_/article/details/125344892

版权

文献阅读笔记专栏收录该内容

11 篇文章

订阅专栏

总结

目前主流的语音识别方法大多基于深度神经网络，这些方法大体分为两类：
一类是采用一定的神经网络取代传统语音识别方法中的个别模块，如特征提取、声学模型或语言模型等；另一类是基于神经网络实习端到端的语音识别。

展望

未来语音识别领域的研究方向可大致归纳如下：
（1）模型压缩与加速；
（2）数据迁移。在面对小样本数据或复杂问题时，迁移学习是一种有效的方式；
（3）多模态数据融合。对于一些复杂的语音场景，可以利用语音信号和其他信号进行融合，以提高语音识别性能；
（4）多技术融合。当前大多数语音识别算法只关注识别文字内容的正确性，然而许多智能语音交互的应用还未涉及到语义的理解。因此，将语音识别技术结合其他技术也是未来研究方向之一。

我是小蔡呀～～～

博客等级

码龄6年

44
原创

53
点赞

203
收藏

406
粉丝

关注

私信

热门文章

分类专栏

最新评论

【论文精度】ViT(AN IMAGE IS WORTH 16*16 WORDS:TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE)
CSDN-Ada助手: 非常棒的分享！ViT这个模型确实在图像识别领域有很大的用途。希望你能继续分享更多的深度学习领域的技术和想法。如果你需要一个建议的话，我建议你可以写一篇关于“GPT-3”的博客，它是一款使用了自然语言处理和深度学习的神经网络模型，它的作用是生成人工智能的语言。它的开发公司Open AI宣称它是史上最强大的自然语言处理AI，这个话题非常有趣和有价值，期待你的分享！ 2023年博客之星「城市赛道」年中评选已开启（https://activity.csdn.net/creatActivity?id=10470&utm_source=blog_comment_city ），博主的原力值在所在城市已经名列前茅，持续创作就有机会成为所在城市的 TOP1 博主（https://bbs.csdn.net/forums/blogstar2023?typeId=3152981&utm_source=blog_comment_city），更有丰厚奖品等你来拿~。
DenseNet与ResNet
小余要努力: 支持原创好文，望回关
【论文精度（李沐老师）】Generative Adversarial Nets
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN月度精选】榜单，全部的排名请看 https://bbs.csdn.net/topics/615017725。
【论文精读（李沐老师）】BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN一周精选】榜单，全部的排名请看 https://bbs.csdn.net/topics/614690782。
【论文精读（李沐老师）】BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/614567934。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

我是小蔡呀～～～ 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。