开源最前线(ID:OpenSourceTop) 猿妹编译
链接:https://fosspost.org/lists/open-source-speech-recognition-speech-to-text
语音文字转换(STT)系统,一种能够将语音单词转换成文本的方法,用途十分广泛,比如我们经常在用的微信聊天中语音转文字功能。
过去,语音转文本技术由专有软件和库控制;开源替代方案不存在或存在极端局限,如今这种形势已经发生变化,今天你可以使用许多开源的语音转文本工具和库,今天,我们就举5个好用的开源语音识别库。
1、DeepSpeech项目
该项目由Mozilla开发,这是一个100%免费的开源语音转文本库,它使用了 TensorFlow 机器学习框架实现去功能。
你可以使用它自己构建训练模型,以增强语音转换到文本的效果,你还可以根据自己的需要引入其他语言,甚至可以轻松把它集成到TensorFlow上的其他机器学习项目中。唯一可惜的是,该项目目前默认情况下仅支持英语。
它也支持多种语言,例如Python(3.6)。运行十分简单:
pip3安装deepspeechdeepspeech --model模