最近开始学习语音识别 (Speech Recognition) 相关
发现了一个结构挺清晰的中文识别小模型
原项目有一些 bug 在此记录下
问题一 module 'torchaudio' has no attribute 'load_wav'
- pytorchaudio 模块版本问题
- 直接将函数
load_wav
改成load()
即可
问题二 No audio I/O backend is available
- 没有安装 backend
- 其实在 torchaudio 在导入的时候会产生一个警告
- Windows 安装
pip install soundfile
- 官方的详细说明: https://pytorch.org/audio/stable/backend.html#soundfile-backend
- 没什么用的测试命令:
torchaudio.list_audio_backends()
- 成功后的输出:
['soundfile']
- (失败为:
[]
)