推荐项目:实时字幕(Live Captions)
项目地址:https://gitcode.com/gh_mirrors/li/LiveCaptions
项目介绍 实时字幕是一款专为Linux桌面设计的应用程序,能够提供即时的字幕服务。只需一键安装,即可在Flathub上轻松获取。应用界面简洁,专注于提供本地化的桌面音频和麦克风输入的实时转录功能,无需依赖任何专有服务或库。
项目技术分析 实时字幕基于aprilasr,这是一个用于实时语音识别的新库。应用的核心是Fangjun Kuang提供的预先训练好的模型,该模型由k2-fsa/icefall项目贡献者创建。虽然当前仅支持英语,但未来可能会有更多的语言模型被训练并发布,以实现更准确、更强大的识别效果。
应用场景
- 在线会议:为听力受限的人士提供会议内容的实时文字转译。
- 视频播放:观看没有内置字幕的视频时,提供辅助性的文字解说。
- 教育场景:教师可以开启实时字幕来帮助学生更好地理解课程内容。
- 单独工作时收听播客或录音,通过字幕了解内容而不用戴耳机。
项目特点
- 简单易用:直观的用户界面,设置快速。
- 隐私保护:所有音频处理都在本地完成,信息不外传。
- 高度自定义:可调整字体、大小和文本格式(如大小写)。
- 信心度显示:可选的功能,根据识别的确定性级别动态改变字幕的淡入淡出效果。
- 硬件兼容性广:已成功测试运行在多种不同年代的CPU上,包括老旧设备如2011年的Intel i7-2670QM,以及最新的Steam Deck。
构建与运行 对于开发者来说,该项目提供了两种简单的构建方式:使用GNOME Builder进行图形化构建,或者通过命令行。此外,需要提前下载ONNXRuntime库,并设置环境变量,还需要一些其他依赖包如Pulseaudio和libadwaita。
总的来说,实时字幕是一个实用且尊重用户隐私的工具,尤其适合那些需要实时文字转译的场合。无论你是开发者还是普通用户,都值得尝试这个开源项目,体验它所带来的便利。立即加入项目Discord群组,保持最新消息的同步吧!