一.Whisper 项目地址
1.GitHub项目地址
https://github.com/openai/whisper
二.Whisper项目简介
Whisper 是 OpenAI 开源的语音神器,可以实现识别音频、视频中的人声,并将人声转换为字幕内容,保存到文件;
三.Whisper 安装教程
1.下载并安装Python(版本范围: 3.9~3.10)
Python官网
https://www.python.org
2.安装Whisper
pip3 install -U openai-whisper
3.安装ffmpeg
brew install ffmpeg
4.安装setuptools-rust
pip3 install setuptools-rust
四.命令行使用
1.使用Whisper识别音频人声
cd whisper
whisper audio.mp3 --language Chinese --fp16 False
2.使用Whisper对指定音频文件进行人声识别,并将内容识别内容翻译为英文
whisper audio.mp3 --language Chinese --task translate --fp16 False