Distil-Whisper 安装和配置指南

最新推荐文章于 2025-01-18 10:43:21 发布

姬笛纳Kay

最新推荐文章于 2025-01-18 10:43:21 发布

阅读量531

点赞数 4

本文链接：https://blog.csdn.net/gitblog_07853/article/details/142234479

版权

Distil-Whisper 安装和配置指南

distil-whisper Distilled variant of Whisper for speech recognition. 6x faster, 50% smaller, within 1% word error rate. 项目地址: https://gitcode.com/gh_mirrors/di/distil-whisper

1. 项目基础介绍和主要编程语言

项目介绍

Distil-Whisper 是 Whisper 的一个蒸馏版本，由 Hugging Face 开发。它比原始的 Whisper 模型快 6 倍，体积小 50%，并且在分布外评估集上的词错误率（WER）仅比 Whisper 高 1%。Distil-Whisper 主要用于语音识别任务，特别适合需要快速处理和低资源占用的应用场景。

主要编程语言

Distil-Whisper 项目主要使用 Python 编程语言。

2. 项目使用的关键技术和框架

关键技术

语音识别：Distil-Whisper 专注于语音识别任务，能够将语音转换为文本。
模型蒸馏：通过知识蒸馏技术，Distil-Whisper 从 Whisper 模型中提取关键信息，生成更小、更快的模型。

主要框架

Hugging Face Transformers：Distil-Whisper 基于 Hugging Face 的 Transformers 库，这是一个广泛使用的自然语言处理（NLP）和语音处理库。
PyTorch：Distil-Whisper 使用 PyTorch 作为其深度学习框架。

3. 项目安装和配置的准备工作和详细安装步骤

准备工作

在开始安装之前，请确保您的系统已经安装了以下软件和库：

Python 3.7 或更高版本
Git
Pip（Python 包管理工具）

详细安装步骤

1. 克隆项目仓库

首先，使用 Git 克隆 Distil-Whisper 项目到您的本地机器：

git clone https://github.com/huggingface/distil-whisper.git

2. 进入项目目录

进入克隆下来的项目目录：

cd distil-whisper

3. 创建虚拟环境（可选）

为了隔离项目的依赖环境，建议创建一个虚拟环境：

python3 -m venv distil-whisper-env
source distil-whisper-env/bin/activate  # 在 Windows 上使用 `distil-whisper-env\Scripts\activate`

4. 安装依赖

使用 Pip 安装项目所需的依赖：

pip install --upgrade pip
pip install -r requirements.txt

5. 安装 Distil-Whisper

安装 Distil-Whisper 模型：

pip install .

6. 验证安装

安装完成后，您可以运行以下命令来验证 Distil-Whisper 是否安装成功：

from transformers import AutoModelForSpeechSeq2Seq, AutoProcessor

model_id = "distil-whisper/distil-large-v3"
model = AutoModelForSpeechSeq2Seq.from_pretrained(model_id)
processor = AutoProcessor.from_pretrained(model_id)

print("Distil-Whisper 安装成功！")