今天给大家分享一款实时语音转录的工具——whisperlive,这是github上的一款开源项目(项目地址:https://github.com/collabora/WhisperLive),基于whisper改进,通过实时的语音转录,可以完成实时会议记录、实时翻译、字幕制作等任务。
个人测试了一下,实时的转录的速度和准确率都是很不错的,主要是开源还可以diy哈哈哈,因此就把它打包成了一键安装包(在本文末尾处),分享给大家,相关的使用视频也放在了b站上(https://www.bilibili.com/video/BV1DzsueeEC7/?spm_id_from=333.999.0.0&vd_source=15da9306001a5077ef66951046b71de3),下面给大家简单展示下使用过程和效果。
1、首先,解压一键安装包后,看到项目启动(双击).bat。
2、双击后,会分别启动服务端终端和客户端终端,等几秒钟后,便出现等待声音的标识,此时就可以通过麦克风说话,实时转录的信息也显示在终端里面。
效果还是很不错滴
3、最后,我们在根目录中可以找到自动生成的音频文件和字幕文件,方便我们后续的操作。
字幕文件结果如下图。
详细的操作在b站的视频里,好了,大家快去体验一下吧!!
WhisperLive一键安装包链接: https://pan.baidu.com/s/1nXsEYM2gNMc0e6iySsnkTw 提取码: mc5k
实时语音转文本,一键安装包部署whisperlive!
最新推荐文章于 2025-04-02 11:25:08 发布