语音识别（SR）的秘密

最新推荐文章于 2022-12-01 08:30:59 发布

yuanmeng001

最新推荐文章于 2022-12-01 08:30:59 发布

阅读量2.4k

点赞数 1

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yuanmeng001/article/details/46871365

版权

语音识别（SR）功能是当今国外操作系统的标准特征，而国产操作系统根本不具备这种特质，而且国家队没有相关的主观动力，去开发实际可用的语音识别系统。与国外相比，国产操作系统落后了一大节子，怪谁？

怎样让机器识别人的语音？其实大道理并不复杂，首先，让机器设备听懂元音，然后听懂辅音，将两者合成起来成为单词，再做进一步的处理。但是，实际做起来就复杂了。怎么做？

建立“语料库”（Corpus），就是建立语音的声学模型库。比如，”猫“这个单词的发音，必须让机器记住“猫”的发音，设法让机器听到“猫”所对应的“声音”（所谓”生物信号“）就知道主人对它说的是“猫”。语料库就是建立单词与语音的对应关系。这是基本建设，需要投入大量的人力、物力，别无他法。

任何语音都有个人特征，虽然100个人的发音基本相同，但是，存在一定的差异。所以机器的听觉总是存在“错误率”，这是必然的。降低机器识别错误率是必要的，这是一个基本认识，对机器不能要求过高。机器耳朵永远比不过人耳。

微软、谷歌、百度语音识别巨头都拥有各自的数万小时的语料库，但是，我们却没有，Linux社区也没有GPL可用的语料库（VoxForge不带我们玩）。怎么办？天上不会自动掉馅饼。要知道，私有公司建立自己的版权大型语料库总是要付出巨大的投入成本。而我们有人喜欢天上掉馅饼，整天坐在院子里面张着大嘴巴对着蓝天等着天上掉下馅饼来。

袁萌 7月14日

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

yuanmeng001 CSDN认证博客专家 CSDN认证企业博客

码龄18年

4991: 原创

7892: 周排名

174万+: 总排名

1689万+: 访问

: 等级

23万+: 积分

1万+: 粉丝

1468: 获赞

2万+: 评论

408: 收藏

私信

关注

热门文章

分类专栏

微积分 37篇
开源 640篇
综合 519篇
原创 911篇

最新评论

陈景润定理不是谎言
2401_85303946: https://blog.csdn.net/2401_85303946/article/details/139237409 【陈景润，一个数学智障人士】
希尔伯特几何基础序言
小明: 这篇文章内容丰富，信息量大！作者在解释每个知识点时，力求详尽清晰，使读者能够轻松理解和掌握。此外，文章引用了一些具有代表性的代码片段，不仅展示了编程的魅力，还帮助读者更好地理解相关概念和技巧。
莱布尼兹乘积微分公式证明纠错
计算机魔术师: 这个是古典微积分，基于无穷小量的理论，这个是不严格的证明，需要极限微积分的具体证明，文中给出的超实数是近代对无穷小量的完善，可以见非标准积分的领域
基础微积分教材封面中译者致敬
madak1: 哪里能够下载或者购买啊？’
潜无穷与实无穷
普通网友: 大佬的文章写的太精辟了让我深刻了解了这篇文章的精髓谢谢大佬分享，希望继续创作优质博文。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。