Whisper是 OpenAI 2022年发布的一款语音预训练大模型,集成了多语种ASR、语音翻译、语种识别的功能。
Whisper使用弱监督训练的方法,可以直接进行多任务的学习
1. 安装ffmpeg
1.1 更新yum
yum update
1.2 安装gcc
yum install gcc
1.3 在线安装ffmpeg
1.3.1 Install the EPEL repository
yum install epel-release
1.3.2 install ffmpeg
yum install ffmpeg
1.4 离线安装ffmpeg
1.4.1 安装yasm
# 下载
wget -c http://www.tortall.net/projects/yasm/releases/yasm-1.
本文详细介绍了如何在本地环境中部署Whisper模型,包括安装ffmpeg、激活conda环境、安装依赖和部署WebUI,以实现语音识别和转换功能。首先更新yum并安装gcc,接着在线或离线安装ffmpeg。然后创建并激活虚拟环境,安装pytorch和相关依赖。最后,下载Whisper模型,部署WebUI并修改配置文件以适应国内环境。
订阅专栏 解锁全文
&spm=1001.2101.3001.5002&articleId=135947056&d=1&t=3&u=4c3d8e54412040098eedf9fa3be3f55a)
4437

被折叠的 条评论
为什么被折叠?



