python语音识别框架_横评：五款免费开源的语音识别工具

最新推荐文章于 2024-05-03 22:41:38 发布

weixin_39620943

最新推荐文章于 2024-05-03 22:41:38 发布

阅读量893

点赞数

文章标签： python语音识别框架

本文链接：https://blog.csdn.net/weixin_39620943/article/details/111521804

版权

编者按：本文原作者 Cindi Thompson，美国德克萨斯大学奥斯汀分校(University of Texas at Austin)计算机科学博士，数据科学咨询公司硅谷数据科学(Silicon Valley Data Science，SVDS)首席科学家，在机器学习、自然语言处理等领域具有丰富的学术研究和产业界从业经验。雷锋网编译。

作为 SVDS 研究团队的成员，我们会经常接触各种不同的语音识别技术，也差不多见证了语音识别技术近几年的发展。直到几年之前，最先进的语音技术方案大多都是以语音为基础的(phonetic-based)，包括发音模型(Pronunciation models)，声学模型(Acoustic Modelling)和语言模型(Language Model)等。通常情况下，这些模型大多都是以隐马尔可夫模型(HMM)和 N-gram 模型为核心的。未来，我们希望以这些传统模型为基础，探索一些诸如与百度 Deep Speech 等最新的语音识别系统相结合的新技术。当然，目前互联网上可以找到许多针对这些基础模型进行解释、汇总的文章和资料，但针对它们之间的差别和特点展开阐述的却并不多。

为此，我们对比了五款基于 HMM 和 N-gram 模型的语音识别工具：CMU Sphinx，Kaldi，HTK，Julius 和 ISIP。它们都是开源世界的顶级项目，与 Dragon 和 Cortana 等商业语音识别工具不同，这些开源、免费的工具可以为开发者提供更大的自由度以及更低的开发成本，因此在开发圈始终保持着强大的生命力。

需要提前说明的是：以下分析大多来源于我们的主观经验，同时也参考了互联网上的其他

最低0.47元/天解锁文章

weixin_39620943

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
python语音识别框架_横评：五款免费开源的语音识别工具

编者按：本文原作者 Cindi Thompson，美国德克萨斯大学奥斯汀分校(University of Texas at Austin)计算机科学博士，数据科学咨询公司硅谷数据科学(Silicon Valley Data Science，SVDS)首席科学家，在机器学习、自然语言处理等领域具有丰富的学术研究和产业界从业经验。雷锋网编译。作为 SVDS 研究团队的成员，我们会经常接触各种不同的语音...
复制链接

扫一扫