tensorflow 语音识别_5 款不错的开源语音识别/语音文字转换系统

本文介绍了5个开源的语音识别工具,包括Mozilla的DeepSpeech、Kaldi、Julius、Wav2Letter++和百度的DeepSpeech2。这些工具基于TensorFlow等深度学习框架,支持多种平台和语言,可用于各种语音转文本应用场景。
摘要由CSDN通过智能技术生成

4fbee68439470bd76c3109fea67df1aa.png
语音文字转换 (STT) 系统就像它名字所蕴含的意思那样,是一种将说出的单词转换为文本文件以供后续用途的方式。
-- Simon James(作者)

语音文字转换(speech-to-text)(STT)系统就像它名字所蕴含的意思那样,是一种将说出的单词转换为文本文件以供后续用途的方式。

语音文字转换技术非常有用。它可以用到许多应用中,例如自动转录,使用自己的声音写书籍或文本,用生成的文本文件和其他工具做复杂的分析等。

在过去,语音文字转换技术以专有软件和库为主导,要么没有开源替代品,要么有着严格的限制,也没有社区。这一点正在发生改变,当今有许多开源语音文字转换工具和库可以让你随时使用。

这里我列出了 5 个。

开源语音识别库

DeepSpeech 项目

04d49f01f9425f9ac6d9426064298308.png

该项目由 Firefox 浏览器的开发组织 Mozilla 团队开发。它

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值