9.8k star! 基于大模型的音频转文字工具,零门槛上手

我们经常会遇到将音频转为文字的情况,比如在开会时录音的会议纪要、上课时录下的老师讲课内容。虽然网上也有一些在线的工具可以将音频转为文字,但是考虑到数据安全和费用问题,使用起来也不是很方便。

今天给大家介绍一款开源工具——Buzz,他可以让你在本地离线的识别音频并转换成文字。

项目介绍

Buzz 是一款开源的语音转文字工具,它能够实时将语音转换为文字,支持多种操作系统,包括 Windows、macOS 和 Linux。它不仅支持实时语音识别,还能将视频和音频文件转换成文字或字幕,极大地方便了内容创作者、翻译工作者和广大用户。

项目使用

因为是跨平台的工具,Windows 用户可以在 release 页面下载安装包,Mac 用户可以使用 brew install --cask buzz 命令安装应用。

打开应用,可以看到界面非常简洁:

点击上方菜单栏的“➕”,可以选择音频文件。之后在弹出的对话框中选择要使用的模型、任务以及语言。这里我们就使用默认的 Whisper 的 base 模型,任务选择“Transcribe”即可将语音转换为文字。

点击“Run”按钮后,软件会自动下载模型文件,并进行转换。转换完毕的任务会在首页列表显示,如图:

双击任务,即可查看转换成功的文字,如图:

你可以在这个页面查看每句话的所在的音频时间,并且播放音频。还可以点击右下角的下载按钮,将文件导出为 txt 格式或者 srt 的字幕格式。

当然,Buzz 还支持实时的语音转文字和翻译功能。首页点击左上角的小麦克风按钮,即可进入实时录音的界面。依旧是配置好使用的模型和任务类型,点击“Record”按钮,即可实时的转换文字了。

总结

随着开源的大型模型日益增多,以及 GitHub 上涌现的众多整合了这些大型模型的工具,我们得以以更低的门槛在个人电脑上运行这些模型,从而帮助我们完成更多的工作。Buzz 就是这么一款使用方便的语音转文字工具,如果你有类似的需求,就赶快去试试吧。

项目地址:https://github.com/chidiwilliams/buzz

彩蛋时间

感谢你看到最后,作为如果你对开源感兴趣,欢迎关注我的公众号。回复eeee888,获取程序员面试指南以及海量学习资料~

  • 5
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小白码上飞

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值