我们经常会遇到将音频转为文字的情况,比如在开会时录音的会议纪要、上课时录下的老师讲课内容。虽然网上也有一些在线的工具可以将音频转为文字,但是考虑到数据安全和费用问题,使用起来也不是很方便。
今天给大家介绍一款开源工具——Buzz,他可以让你在本地离线的识别音频并转换成文字。
项目介绍
Buzz 是一款开源的语音转文字工具,它能够实时将语音转换为文字,支持多种操作系统,包括 Windows、macOS 和 Linux。它不仅支持实时语音识别,还能将视频和音频文件转换成文字或字幕,极大地方便了内容创作者、翻译工作者和广大用户。
项目使用
因为是跨平台的工具,Windows 用户可以在 release 页面下载安装包,Mac 用户可以使用 brew install --cask buzz
命令安装应用。
打开应用,可以看到界面非常简洁:
点击上方菜单栏的“➕”,可以选择音频文件。之后在弹出的对话框中选择要使用的模型、任务以及语言。这里我们就使用默认的 Whisper 的 base 模型,任务选择“Transcribe”即可将语音转换为文字。
点击“Run”按钮后,软件会自动下载模型文件,并进行转换。转换完毕的任务会在首页列表显示,如图: