💎个人主页:Tech智汇站
( ̄︶ ̄)↗
建议收藏!完全免费离线、本地实现音频视频转文字
情景再现
不知道大家有没有遇到过这种情景?看视频时,有的视频时长太久,而且里面的信息很分散,大部分都是一些自己觉得不太重要的内容。
这时候你倍速快了吧听不清,倍速慢了又觉得听着无聊浪费时间、右键快进吧怕错过关键的信息。反复地快进和快退搞得身心烦躁。
那么你可以尝试用下面的方式将视频转换成文字,这样一个内容密度不紧凑的长视频就能轻松的学习完啦,不会因为快进而错过重要知识。
Tech智汇君使用过的很多小程序提供这样的功能,但不外乎都是限制时长,收费,速度慢等缺点。下面的工具完全可以弥补这些问题。
此外这对于自媒体博主制作视频时添加字幕也是一款好的工具~
工具介绍
Tech智汇君分享一个GitHub 3000+ Star的音、视频转文字项目CapsWriter-Offline,它:
- 完全离线、无限时长
- 低延迟、高准确率
- 中英混输、热词功能
- 支持离线、实时转录
- 普通文本、字幕文件等
- xxx
实际效果如图,用87s转换了一个38min的视频。转换速度取决于电脑配置,Tech智汇君使用的是一款18年的游戏本。
转换效果预览
输出结果有三种格式(json格式一般用不到)的文本文件:带标点符号txt、不带标点符号txt、字幕文件srt
srt字幕文件和原视频放在一个目录,用播放器打开视频可以显示字幕效果。
生成字幕文件功能对自媒体博主挺有用,将自己录制好的视频生成好srt文件后,对字幕内容进一步修改使其更准确,再到剪映里定制字幕样式或者上传视频时直接上传字幕文件。
离线转换视频、音频
点击start_server.exe启动好服务端后,将本地的音视频文件拖动到start_client.exe文件上就可以了。生成的文本文件和原音、视频文件在同一个目录。
实时语音转换
客户端成功连接到服务端后,点击默认的CapsLock键就可以进行实时语音转换了。录入的语音会以Mp3格式记录下来,转换后的结果会记录到markdown文件里。
高阶玩法
-在同一局域网下,用其它电脑客户端连接同一台服务端
-使用热词功能,实现内容转换成自己喜欢的样式
-深度配置,对细节进行把控
-使用GUI界面版本,不使用黑色终端窗口
GUI界面版本
在这里就不演示了,因为功能都差不多且需要重新下载,我把地址和普通版放在了一起,感兴趣的小伙伴可以研究一下,它效果如下图:
应用安装
电脑系统是64位且win10系统或者以上
内存最好8G以上
打开链接,可以根据软件发布地址或者网盘分享链接下载安装。这里只演示发布地址的安装方法,因为网盘里就是前者下载后的资源。
打开发布地址后,点击右下角最新的releases,下载CapsWriter-Offline-Windows-64bit.zip和models.zip。先将第一个文件解压到电脑某个磁盘目录,再将第二个文件解压后的内容放到第一文件夹models下,如下图。
其次在电脑卸载软件的地方确认一下电脑是否安装有 Microsoft Visual C++ Redistributable 运行库,没有的话需要安装一下!
上述步骤完成后,点击start_server就可以启动服务端了,等对应的模型加载完成后【如下图服务端窗口】,就可以点击start_client客户端连接使用了~【如下图客户端窗口】
项目发布地址里的README强烈建议大家看一看,因为官方对软件的介绍、使用说得很详细。
重要提醒
如果你还没关注我,而你又对效率工具、AI等内容感兴趣,请你给我一个小小的关注,我会持续发布相关内容。
燕雀安知鸿鹄之志!
-END-