9.8k star! 基于大模型的音频转文字工具，零门槛上手

最新推荐文章于 2025-03-27 10:46:32 发布

小白码上飞

最新推荐文章于 2025-03-27 10:46:32 发布

阅读量1k

点赞数 5

分类专栏：开源项目文章标签：音视频

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u011291072/article/details/140588204

版权

我们经常会遇到将音频转为文字的情况，比如在开会时录音的会议纪要、上课时录下的老师讲课内容。虽然网上也有一些在线的工具可以将音频转为文字，但是考虑到数据安全和费用问题，使用起来也不是很方便。

今天给大家介绍一款开源工具——Buzz，他可以让你在本地离线的识别音频并转换成文字。

项目介绍

Buzz 是一款开源的语音转文字工具，它能够实时将语音转换为文字，支持多种操作系统，包括 Windows、macOS 和 Linux。它不仅支持实时语音识别，还能将视频和音频文件转换成文字或字幕，极大地方便了内容创作者、翻译工作者和广大用户。

项目使用

因为是跨平台的工具，Windows 用户可以在 release 页面下载安装包，Mac 用户可以使用 brew install --cask buzz 命令安装应用。

打开应用，可以看到界面非常简洁：

点击上方菜单栏的“➕”，可以选择音频文件。之后在弹出的对话框中选择要使用的模型、任务以及语言。这里我们就使用默认的 Whisper 的 base 模型，任务选择“Transcribe”即可将语音转换为文字。

点击“Run”按钮后，软件会自动下载模型文件，并进行转换。转换完毕的任务会在首页列表显示，如图：

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

小白码上飞 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。