AI探索实践4 - 让AI翻译马斯克推荐的视频的2388行英文字幕的折腾过程、问题和收获

本文链接：https://blog.csdn.net/hjingfeng/article/details/136263860

大家好，我是Feng，欢迎和我一起探索使用AI相关技术。

回顾

在 AI探索实践1- 使用大模型情感分析一文中，我们能够利用AI来提供客户关系管理、客户服务自动化等实际的业务帮助。
在 AI探索实践2 - 3分钟为视频加上双语字幕一文中，我们可以利用AI翻译的能力，来帮我们快速生成指定格式的字幕内容。
在 AI探索实践3 - 3秒钟生成海量内容指定格式的重点分析、结论一文中，我们对AI的文本摘要能力做了初步了解。

这篇文章是对今天折腾的一个视频中文字幕的过程回顾，通过解决遇到的问题的过程，进一步了解国内大模型的中国特色。

不过，最大的亮点，在文末。

马斯克的推荐

事情源于看到了一篇资讯，如图：
在这里插入图片描述
看到大名鼎鼎的马斯克都推荐，自然想了解一下视频到底在说了啥。当然了，得先加上咱的中文字幕。于是，按照之前的经验【 AI探索实践2 - 3分钟为视频加上双语字幕】，开始折腾。

折腾字幕

2. 1 提取视频英文字幕

想方设法把视频下载到本地后，首先当然是要把英文字幕提取出来。

2.1.1 打开剪映，导入视频

打开剪映的app，点击 开始创作 按钮，进入软件。
在这里插入图片描述
2) 导入视频。点击导入，选择文件

当鼠标移动到左上方这个视频缩略图上时，在右下角会出现一个 + 号。点击它。会将视频添加到轨道上。我们暂时不用理解轨道是什么，先这样做就好。

2.1.2 读取视频的字幕

鼠标右键点击在下方的视频轨道上：
在这里插入图片描述
会出现在将音频转为文本的过程：

分析音轨、转为文本完毕后，字幕会出现的视频的上方：

2.1.3 导出字幕，交由AI翻译

在软件的右上角，有一个导出按钮，点击它，注意不要导出视频：
在这里插入图片描述
导出的是一个srt文件，用vscode（或者记事本也行）打开如下图：

英文字幕：共计2183行。字幕格式比较好理解，3行代表一个画面：
第一行：画面序号，从1开始。
第二行：是这个画面的停留起止时间。
第三行：画面声音对应的英文字幕

2.2 翻译字幕

我的目的是增加一行中文字幕，这样即使翻译的不对，有英文对照也容易更正。

2.2.1 选择 kimi

AI大模型对于字幕的翻译，我选择了kimi。不仅是因为春节期间，🔥了一把的“哄哄模拟器”的后端就是由kimi的官方：【月之暗面】提供的大模型技术支持，也是因为kimi是目前我了解到的，会话上下文支持最长的大模型，其最长支持达到了20万字。相比国内其他大模型的32K长度的2000个汉字长度来说，简直秒杀。而且，它支持上传文件，不再需要在input中粘贴大量的文本。

使用起来很简单，上传文件，发送提示语，然后可以等结果了。

注：kimi对文件格式有要求，不支持srt。因此我将字幕文件的后缀改为 txt 就能符合kimi的要求。kimi马上就能给你返回翻译的结果：
在这里插入图片描述