《AI上字幕》基于openAI研发的whisper模型，语音（视频）一键转文本/字幕/带时间轴/支持多语言/自带翻译《桌面版教程》

ASH晗

已于 2023-03-19 01:19:23 修改

阅读量6k

点赞数 5

文章标签：人工智能语音识别

于 2023-03-19 01:07:43 首次发布

本文链接：https://blog.csdn.net/qq_45366830/article/details/129644610

版权

简介：

OpenAI的chatGPT非常火爆，其实OpenAI旗下的另一个模型实力也十分强大，它就是开源免费的Whisper语音转文本模型，目前为止它是较为顶尖的语音转文本模型

当前github上也有许多出色的开发者根据此模型开发出桌面版语音转文字应用。较为出色的分别是Buzz和WhisperDesktop

功能：

支持将多种语言的视频或者音频文件，转换成字幕文件、带时间轴的文本、纯文本。
支持多语言音翻译成英文
英文可以使用网页翻译功能翻译成中文

用途：

字幕文件导入剪辑软件可以一键上字幕，生产力MAX
配合PotPlayer能够生成双语字幕，学习英语简直离不开它俩
对于纯外语不带字幕靠听力的视频资料，简直不要太友好
视野开阔的必备工具，经常了解世界顶尖科技的童鞋们应该知道，大佬们的视频基本都是口述讲解，有了它，随时随地快速学习。

优劣势：

准确率极高！超出你使用过的绝大多数在线转写！OpenAI训练的模型就不用多说了吧！基本不需要二次修改！
速度超快！Whisper使用GPU进行转写（仅支持N卡），5分钟的视频还是使用最大的模型，亲测只需要30秒！（没有对比就没有伤害，只有剪过视频的同学才知道其他软件的痛）
永久免费！一些在线转字幕网站收费真的很贵，时间真的很长！
对于GPU性能弱的同学，Buzz使用CPU转写，虽然准但是速度真的很慢，使用最大模型5分钟的视频能需要10分钟。
仅支持本地使用，网页视频我从来不会用这个，网页视频可以使用插件生成双语字幕，也很轻松，这里不做过多介绍。

下面贴出他们的官网：GitHub - chidiwilliams/buzz: Buzz transcribes and translates audio offline on your personal computer. Powered by OpenAI's Whisper.和GitHub - Const-me/Whisper: High-performance GPGPU inference of OpenAI's Whisper automatic speech recognition (ASR) model

使用说明：

仅演示Whisper，Buzz和Whisper仅仅是界面不同，从官网下载后打开软件程序，首先选择模型，模型和程序都在上面的官网中。

点击ok等待结束，然后第一栏选择原音视频的语音，translate若勾选则输出英文，不勾选直接输出原音视频语言。

地址栏第一行选择音视频地址，第二行选择输出地址，若勾选place that file选项则代表输出到原文件夹中。output format选项中选择输出类型：纯文本，带时间轴的文本，字幕srt文件等。

结束语：

汪~到这里教程完全结束了！本人不推荐buzz，由于它使用cpu处理文件，导致它处理速度和其他软件速度不相上下。如果您的电脑为轻薄本，建议使用在线服务，例如讯飞每天有免费额度官网如下：讯飞听见-免费在线录音转文字-语音转文字-录音整理-语音翻译软件

但是您仍然可以使用buzz因为它真的很准确，远超其他软件并且免费。

博主有话说：

算是给看到最后的人的福利吧建议看完

还记得三四年前大概是我大一的时候，剪视频只能用一写普通的模型转换文字，准确率很差，每次几乎每句话都要重新修改，加字幕甚至需要一个小时以上，累得要死。

一两年前，出现了类似讯飞这种语音行业顶尖的企业，准确率大幅提升，我开始用手机语音转文字，再把文字放入剪映中，加字幕不到半小时，但还是很麻烦。

现在，AI训练无数参数生成的模型，准确率高的不用我再检查，一键生成工具能够调用模型，生成处理完成仅用几分钟。

人工智能真的是发展的飞快，世间也是沧海桑田，合理运用工具的人只会效率更高，我深有感触，在最近的这些日子里，我学会了用chatgpt的API总结视频网站，一瞬间爬取字幕，并总结视频。这让我学习教学视频时知道哪些是我想要的，能够快速获取知识点。我学会了一键用chatgpt总结网页，并列举主要内容，这使我在学习不同领域的知识时能够快速获取要点，还有好多。。

有些跑题了，就说到这里，但是这些能够真真切切的提升我的学习效率。有那么一句话真的说的很对，AI不一定会淘汰你，淘汰你的是使用AI工具的人。至此，对大家进行警醒，跟随时代进步，我们才会进步。否则我们就会像上一代长辈不会使用手机一样，被时代淘汰。

人生，是不断的学习的过程，共勉。

以后在我博客中，不会再提及类似的感悟，算是给现在关注我的几十个粉丝们的小福利吧！最后，文章内容全部手打，本文用时6个小时。喜欢的朋友快来关注我吧！汪！（后续的文章可能会越来越精简了）

附图

附图：调用chatgpt的api总结一篇教学文章，文章是随机找的。

附图：对某个网页视频进行总结。

还没想好后续写什么，关注我，由浅入深学东西，欢迎私信！