环境:系统ubuntu16.04,显卡是NVIDIA Quadro RTX5000
目标:安装语音识别工具whipser/whipser-ctranslate2
因之前有过几次在linux和windows上有过部署whisper经验和使用经验,其中有使用GPU的,有CPU的,各自语音识别效率一言难尽,建议直接装whipser-ctranslate2。同时,感谢B站博主的(Windows系统 Whisper(OpenAI) 安装指南(全局python环境) - 哔哩哔哩)这篇文章曾给我一些启发,有需求的小伙伴可以先参考这篇文章了解一下。
一、whipser-ctranslate2介绍
whipser-ctranslate2是相比whipser而言,识别速率更快,占用内存空间更小的语音识别工具,GitHub使用介绍参见:
faster-whisper是使用CTranslate2重新实现 OpenAI 的 Whisper 模型,CTranslate2 是 Transformer 模型的快速推理引擎。比whisper快 4 倍,但使用的内存更少,且具有相同的精度。GitHub使用介绍参见:
Github介绍whipser-ctranslate2是一个基于faster-whisper的命令行客户端,与openai/whisper的原始客户端兼容。在这里只介绍一下whipser-ctranslate2的安装过程和踩坑。
二、准备环境
说明:我这里没有通过conda/anaconda建立虚拟环境安装python等,是直接在系统上安装的。两种方式各有各的优点,这里不赘述。