给大家分享一个基于 新一代 Kaldi 的子项目 sherpa-onnx 在 x3 派上进行语音识别的例子. (完全开源、完全免费)
1. 安装
下面这个截图演示了如何安装 sherpa-onnx
可以去 https://pypi.org/project/sherpa-onnx/1.9.8/#files下载需要的 whl
(请永远下载最新的。截图里用的是 1.7.11, 上面链接是 1.9.8. 当你看到本文的时候,版本可能又更新了。请去
https://pypi.org/project/sherpa-onnx/#history 查找最新的版本)
如果你的板子可以联网,那么你只需要 运行
pip install sherpa-onnx
2. 下载模型
可以去
https://k2-fsa.github.io/sherpa/onnx/pretrained_models/index.html
下载一个适合你的模型。
下面截图显示了 streaming zipformer 和 non-streaming paraformer 模型在 x3 排上的 RTF.
3. 实时识别
如果你想进行实时的语音识别,比如,读去麦克风,边说话边识别,请参考
https://k2-fsa.github.io/sherpa/onnx/install/index.html
从源码编译 sherpa-onnx, 你会得到一个 binary: sherpa-onnx-alsa, 它支持读取麦克风,进行实时的识别.
4. 文档及帮助
文档: https://k2-fsa.github.io/sherpa/onnx/index.html
帮助: 请在 github 对应的 repo 提 issue, 或者从文档中找到我们的联系方式,联系我们.