deepspeech实时语音识别

DeepSpeech-examples/README.rst at r0.6 · mozilla/DeepSpeech-examples · GitHub

下载该工程

git clone https://github.com/mozilla/DeepSpeech-examples.git

安装依赖

conda install numpy
sudo apt install portaudio19-dev 
pip install pyaudio
pip install deepspeech
pip install webrtcvad
pip install halo
conda install scipy

注意的一点是,pyaudio不要用conda安装,会报一个错

OSError: [Errno -9996] Invalid input device (no default output device)

下载model

Releases · mozilla/DeepSpeech · GitHub

或者

cd mic_vad_streaming/

wget -c https://github.com/mozilla/DeepSpeech/releases/download/v0.6.0/deepspeech-0.6.0-models.tar.gz

tar xvf deepspeech-0.6.0-models.tar.gz

执行如下命令开始语音识别

python3 mic_vad_streaming.py \
  --model deepspeech-0.6.0-models/output_graph.pbmm \
  --lm deepspeech-0.6.0-models/lm.binary \
  --trie deepspeech-0.6.0-models/trie

如果要支持GPU,应该安装GPU版本的deepspeech

pip install deepspeech-gpu
conda install cudatoolkit==10.0.130

_____________________________________________________________________

如果是识别指定语音文件的话,我用上面的代码感觉识别不成功,按道理命令

python mic_vad_streaming.py --model deepspeech-0.6.0-models/output_graph.pbmm --lm deepspeech-0.6.0-models/lm.binary --trie deepspeech-0.6.0-models/trie --file audio/2830-3980-0043.wav

应该是可以识别语音的,因为该工程下的test.sh的示例命令就是这么写的,但我没有识别成功过

_____________________________________________________________________

通过如下命令可以识别指定语音文件:

下载工程 https://github.com/mozilla/DeepSpeech.git , 进入该工程的 native_client/python 目录,执行如下命令进行指定语音文件识别:

python client.py --model deepspeech-0.6.0-models/output_graph.pbmm --lm deepspeech-0.6.0-models/lm.binary --trie deepspeech-0.6.0-models/trie --audio audio/2830-3980-0043.wav 

极度精简之后(不考虑任何异常情况)直接识别示例语音的核心代码如下:

import numpy as np
import wave
from deepspeech import Model

ds = Model('deepspeech-0.6.0-models/output_graph.pbmm', 500)
ds.enableDecoderWithLM('deepspeech-0.6.0-models/lm.binary', 'deepspeech-0.6.0-models/trie', 0.75, 1.85)
fin = wave.open('audio/2830-3980-0043.wav', 'rb')
audio = np.frombuffer(fin.readframes(fin.getnframes()), np.int16)
fin.close()
print(ds.stt(audio))

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值