系列文章目录
第一章 基于Ubuntu 24.04 搭建wenet语音转文字
第二章 编译运行Android Wenet语音识别
前言
环境:Ubuntu 24.04+python3.12
一、Wenet是什么?
WeNet是出门问问语音团队联合西工大语音实验室开源的一款面向工业落地应用的语音识别工具包,该工具用一套简洁的方案提供了语音识别从训练到部署的一条龙服务,其主要特点如下:
使用conformer网络结构和CTC/attention loss联合优化方法,具有业界一流的识别效果。
提供云上和端上直接部署的方案,最小化模型训练和产品落地之间的工程工作。
框架简洁,模型训练部分完全基于pytorch生态,不依赖于kaldi等安装复杂的工具。
详细的注释和文档,十分适合用于学习端到端语音识别的基础知识和实现细节。
Wenet项目地址:https://github.com/wenet-e2e/wenet
二、使用步骤
1.开发安装
在终端中执行
git clone https://github.com/wenet-e2e/wenet.git
cd wenet
pip install -e .
执行pip install -e .提示错误:
error: externally-managed-environment
× This environment is externally managed
╰─> To install Python packages system-w