本地部署，Whisper: 开源语音识别模型

最新推荐文章于 2025-03-25 22:26:41 发布

DaGod123

最新推荐文章于 2025-03-25 22:26:41 发布

阅读量2.8k

点赞数 23

分类专栏：一键部署AI大模型文章标签： whisper 语音识别人工智能

本文链接：https://blog.csdn.net/fengzhongye51460/article/details/140674421

版权

GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak SupervisionRobust Speech Recognition via Large-Scale Weak Supervision - openai/whisperhttps://github.com/openai/whisper

简介

Whisper 是一个由 OpenAI 训练的强大的开源语音识别模型，它可以将语音转换为文本。Whisper 支持多种语言和语音，并且能够识别不同口音和背景噪音。它在各种语音识别任务中表现出色，包括语音转文本、语音翻译和语音命令识别。

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

DaGod123

关注关注

23
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

学习实践-Whisper语音识别模型实战（部署+运行）

LZL2020LZL的博客

04-12

8649

OpenAI的语音识别模型Whisper，Whisper 是一个自动语音识别（ASR，Automatic Speech Recognition）系统，OpenAI 通过从网络上收集了 68 万小时的多语言（98 种语言）和多任务（multitask）监督数据对 Whisper 进行了训练。OpenAI 认为使用这样一个庞大而多样的数据集，可以提高对口音、背景噪音和技术术语的识别能力。除了可以用于语音识别，Whisper 还能实现多种语言的转录，以及将这些语言翻译成英语。

本地部署whisper模型（语音转文字）

maxcode

01-31

4058

Whisper是 OpenAI 2022年发布的一款语音预训练大模型，集成了多语种ASR、语音翻译、语种识别的功能。Whisper使用弱监督训练的方法，可以直接进行多任务的学习。

参与评论您还未登录，请先登录后发表或查看评论

搭建本地whisper语音识别

weixin_72254790的博客

06-02

2169

本文概述如何快速搭建本地whisper语音识别环境，没有复杂的原理介绍，只搭就完了，实践应用型

语音识别之whisper本地部署（实时语音之开篇）

仗剑行于江湖，执笔记江湖事。

03-25

628

Whisper是由OpenAI开发的开源语音识别模型，以其著称。它通过68万小时的多语言、多任务数据训练，覆盖100+语言，支持语音转录、翻译和语言检测，成为目前最通用的语音识别工具之一。

使用whisper实现语音转文本

zwahut的专栏

11-23

959

pip install --upgrade --no-deps --force-reinstall git+https://github.com/openai/whisper.git这个过程需要很长时间，耐心等等。6、安装setuptools-rust。1、需要py3.8环境。4、安装whisper。5、安装ffmpeg。会逐步输出语音的内容。

语言识别模型whisper学习笔记

tutgxu的博客

03-14

441

语言识别、whisper

语音识别开源项目

热门推荐

github_19776427的专栏

09-13

7万+

语音识别项目： http://www.oschina.net/project/tag/203/tts-speech sf.net http://www.codesoso.net/Search?q=%D3%EF%D2%F4%CA%B6%B1%F0&l=c http://search.codesoso.com/Search?q=%E8%AF%AD%E9%9F

常用语音识别开源四大工具：Kaldi，PaddleSpeech，WeNet，EspNet

声纹感知洞察芯声

05-03

1万+

无论是基于成本效益还是社区支持，我都坚决认为开源才是推动一切应用的动力源泉。下面推荐语音识别开源工具：Kaldi，Paddle，WeNet，EspNet。

Whisper OpenAI开源语音识别模型

在网搬砖的日常

06-04

9013

Whisper 是一个自动语音识别（ASR，Automatic Speech Recognition）系统，OpenAI 通过从网络上收集了 68 万小时的多语言（98 种语言）和多任务（multitask）监督数据对 Whisper 进行了训练。OpenAI 认为使用这样一个庞大而多样的数据集，可以提高对口音、背景噪音和技术术语的识别能力。除了可以用于语音识别，Whisper 还能实现多种语言的转录，以及将这些语言翻译成英语。语音转文字在许多不同领域都有着广泛的应用。

记录本地部署 Whisper 模型的过程

aihuijutang的博客

11-29

5238

通过以上步骤，你已经成功地在本地部署了 Whisper 模型，并利用 CUDA 加速推理过程。使用 Flask 构建了一个简单的 API，使得音频文件的转录变得非常方便。整个部署过程包括了环境准备、依赖安装、模型加载、音频处理、API 构建等步骤。部署 Whisper 模型并不复杂，但需要一定的硬件支持，尤其是在处理大型音频数据时，CUDA 和 GPU 能够提供显著的性能提升。希望本文能够帮助你顺利部署并使用 Whisper 进行语音转录。如果遇到任何问题，欢迎继续提问。

如何本地搭建Whisper语音识别模型：技术分析与实际案例

qq_24087951的博客

09-02

962

Whisper模型以其多语言支持和高效的转录能力，为需要处理语音数据的开发者和研究人员提供了强大的工具。Whisper是OpenAI于2022年开源的一个多语种语音识别模型，支持99种语言，具有高效的转录和翻译能力。如果你的系统上有NVIDIA GPU，并且安装了CUDA，选择合适的PyTorch版本进行安装。：编写Python脚本，遍历测试集中的所有音频文件，使用Whisper模型进行语音识别，并将结果保存到文件中。：确保你的测试集中包含多种语言的音频文件，并准备好它们的路径。为你的音频文件路径。

【AIGC】Whisper语音识别模型概述，应用场景和具体实例及如何本地搭建Whisper语音识别模型？

weixin_51306394的博客

09-04

1849

Whisper是由OpenAI开发的一款通用语音识别模型，该模型自2022年发布以来，因其强大的多语种识别和翻译能力而备受关注。Whisper采用了深度学习技术，特别是基于Transformer的架构，经过大量多样化音频数据的训练，能够识别并转写多种语言和方言中的语音。它集成了多语种ASR（自动语音识别）、语音翻译以及语种识别的功能，具有较高的准确性和鲁棒性。

如何本地搭建Whisper语音识别模型｜语音识别｜本地部署

08-30

1443

在语音识别技术的迅猛发展下，Whisper作为一个开源的语音识别模型，以其卓越的性能和开源的优势受到了广泛的关注。对于开发者和研究人员而言，在本地环境中搭建Whisper模型，不仅能更好地控制数据安全，还能在不同场景中灵活应用。然而，许多人在本地搭建这一模型时可能会遇到诸多挑战。本文将详细介绍如何在本地环境中搭建Whisper语音识别模型，涵盖从环境配置到模型部署的各个环节，并结合代码实例帮助您轻松实现。

【语音识别】WeNet——CPU开源中文语音识别模型选择、部署、封装与流式实现

m0_63589378的博客

07-12

3341

本文介绍了一次ASR项目开发，包括知识介绍、模型选择、部署、封装、流式逻辑实现等内容。

大模型之二十七-语音识别Whisper实例浅析

shichaog的专栏

08-28

9623

output_dir:模型权重存储的位置generation_max_length:在评估时，自回归生成token的最大值save_steps:在训练时，中间的checkpoint将在save_step时被保存eval_steps:在训练时，每eval_steps到达时会评估模型性能report_to：训练的log保持的位置fp16=True,

【机器学习】Whisper：开源语音转文本（speech-to-text）大模型实战_whisper模型

月流霜的专栏

07-26

942

本文是上一篇chatTTS文章的夫妻篇，既然教了大家如何将。

适合新手开发的开源语音识别模型项目——ChatTTS 推荐！

thinkersone的博客

06-25

549

hatTTS是一个基于Python的自然语言处理模型，它使用TensorFlow和NLTK库进行语音识别和文本生成。这个项目旨在提供一个易于使用的工具，以便开发人员可以轻松地将语音识别和文本生成功能集成到他们的应用程序中。

【机器学习】Whisper：开源语音转文本（speech-to-text）大模型实战

人工智能领域博客

06-28

2万+

本文是上一篇chatTTS文章的夫妻篇，既然教了大家如何将文本转语音，就一定要教大家如何将语音转成文本，这样技术体系才完整。首先简要概述了Whisper的模型原理，然后基于transformers的pipeline库2行代码实现了Whisper模型推理，希望可以帮助到大家。码字不易，如果喜欢期待您的关注+3连+投票。

Whisper（语音识别，语音转文本）本地部署

weixin_45972052的博客

04-10

4377

如果后面运行时，出现系统找不到指定文件的bug时，尝试在上一步添加环境变量中，也添加一个系统变量，并重启一下电脑。在虚拟环境中进行安装。

Cherry studio 在windows上本地部署怎么进行语音识别，用whisper 语言模型