Whisper Turbo MLX 使用教程

最新推荐文章于 2025-04-17 11:30:22 发布

仰钰奇

最新推荐文章于 2025-04-17 11:30:22 发布

阅读量221

点赞数 5

本文链接：https://blog.csdn.net/gitblog_00239/article/details/147298212

版权

Whisper Turbo MLX 是一个快速的、轻量级的 Whisper 模型实现，使用 MLX 构建，整个项目包含在一个不足 300 行代码的单一文件中，旨在实现高效的音频转录。

首先，确保您的系统中已经安装了 ffmpeg。接着，按照以下步骤操作：

brew install ffmpeg
git clone https://github.com/JosefAlbers/whisper-turbo-mlx.git
cd whisper-turbo-mlx
pip install -e .

要转录一个音频文件，可以使用以下命令：

wtm test.wav

from whisper_turbo import transcribe

transcribe('test.wav', any_lang=True)

quick 参数允许您选择两种转录方法之一：

quick=True：使用并行处理方法进行更快转录。这种方法可能会产生较为生硬的输出，但速度显著加快，适合速度优先的场景（例如，将生成的转录快速喂给 LLM 以收集多个音频记录的快速摘要）。
quick=False（默认）：使用循环处理方法，速度较慢但产生更忠实和连贯的转录（仍然比其他参考实现快）。

您可以在调用 transcribe 函数时指定这个参数：