横向对比5大开源语音识别工具包，CMU Sphinx最佳

最新推荐文章于 2024-05-03 22:41:38 发布

编程大乐趣

最新推荐文章于 2024-05-03 22:41:38 发布

阅读量986

点赞数

本文横向对比了5个流行的开源语音识别工具包，包括CMU Sphinx、Kaldi、HTK、Julius和ISIP，分析了它们的编程语言、开发工作、社区活跃度、教程和例子以及训练模型。CMU Sphinx因其丰富的教程和即用模型，以及广泛的编程语言支持，被评为最佳选择。

摘要由CSDN通过智能技术生成

目前开源世界里存在多种不同的语音识别工具包，它们为开发者构建应用提供了很大帮助。这些工具各有哪些优劣?数据科学公司 Silicon Valley Data Science 为我们带来了 5 种流行工具包的深度横向对比。此前，他们曾为我们带来过流行深度学习框架的对比：《从 TensorFlow 到 Theano：横向对比七大深度学习框架》。

wKiom1lQuYqij1_UAAGDKFS2pwI121.jpg-wh_651x-s_3059148687.jpg

作为深度学习研发团队的一员，我们对于循环神经网络(RNN)和其他语音识别需要用到的方法都有所涉及。在几年之前，业内***的语音识别系统还是基于语音分析的方法，包含发音、声学和语言模型。通常，这些方法包含 n-gram 语言模型，以及隐马尔科夫模型(HMM)。在此，我们以这种模型作为基准，试图对比目前流行的一些语音识别方法。迄今为止，我们很难看到有人对开源语音识别模型进行过真正对比，希望本文可以抛砖引玉，为大家带来一些帮助。

本文回顾了使用传统 HMM&n-gram 语言模型的开源语音识别工具包。对于用户而言，大多数人都会知道 Siri 或 Cortana 这样的消费产品。而对于研发工程师来说，更灵活、更具专注性的解决方案则更符合需求，很多公司都会研发自己的语音识别通路。以下是目前开源世界上出现的流行工具包，以及我们对它们的各项评价。

最低0.47元/天解锁文章

编程大乐趣

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
横向对比5大开源语音识别工具包，CMU Sphinx最佳

目前开源世界里存在多种不同的语音识别工具包，它们为开发者构建应用提供了很大帮助。这些工具各有哪些优劣?数据科学公司 Silicon Valley Data Science 为我们带来了 5 种流行工具包的深度横向对比。此前，他们曾为我们带来过流行深度学习框架的对比：《从 TensorFlow 到 Theano：横向对比七大深度学习框架》。作为深度学习研发团队的一员，我们对于循环神经网络(RNN...
复制链接

扫一扫