目录
Whisper是一个通用的语音识别模型。它是在不同音频的大型数据集上训练的,也是一个多任务模型,可以执行多语言语音识别、语音翻译和语言识别。
代码仓库
GitHub - openai/whisper:通过大规模弱监督实现鲁棒语音识别
方法1.可以通过pip 安装下载,但是呢这种方式对我们并不透明,后面下载模型要找的麻烦一点。
pip install -U openai-whisper
方法2.通过版本源代码zip的方式放置在项目或者环境中
然后我们只需要压缩包里面的文件夹,把文件夹拉到所需项目或者目标环境中:
选择模型
打开我们刚刚复制文件夹内的whisper\__init__.py中,在里面可以看到(我只展示了部分代码)以下各种模型的下载连接:
_MODELS = {
"tiny.en&