使用智谱AI大模型翻译视频字幕

最新推荐文章于 2025-03-07 16:18:57 发布

张申傲

最新推荐文章于 2025-03-07 16:18:57 发布

阅读量1.6k

点赞数 21

分类专栏： LLM之美文章标签：人工智能 chatgpt aigc

本文链接：https://blog.csdn.net/weixin_34452850/article/details/141679118

版权

不久前，国内的头部大模型厂商智谱 AI ，刚刚推出了 glm-4-0520 模型，该模型被认为是当前平台最先进的模型，具备 128k 的上下文长度，并且相较于前一代模型，指令遵从能力大幅提升 18.6%。可以看出，智谱AI对于该模型寄予厚望。

为了验证这个大模型的性能，我们尝试用它来实现【视频字幕翻译】功能。目前很多视频网站（如B站）上面，大量优质内容都是英文的，并且也没有配备中文的字幕翻译，这对于很多人来说，大大降低了观看体验。因此，我们决定利用大模型，将视频的字幕翻译成中文，这样就可以快速理解视频的大致内容，大幅提升工作与学习效率。

下面，我们以 B站上的视频为例，来实现这个功能。视频链接：https://www.bilibili.com/video/BV1g84y1R7oE/?vd_source=2fd71d56662056b97691b4d7bdf39151

在这里插入图片描述
话不多说，开始写代码。

现在很多视频网站都提供了 OpenAPI，支持获取视频和字幕等相关信息。为了方便开发，我们直接采用 LangChain 封装好的 BiliBiliLoader 来实现视频字幕的加载功能：

首先，我们需要在浏览器登录B站，并且浏览器的开发者工具，获取SESSDATA、JCT 和 BUVID3信息，并保存到环境变量中：

# B站相关配置
BiliBili_SESSDATA=xxx
BiliBili_JCT=xxx
BiliBili_BUVID3=xxx

接下来，我们通过 BiliBiliLoader 工具，加载该视频对应的字幕文本：

import os

import dotenv
from langchain_community.document_loaders import BiliBiliLoader

# 加载环境变量
dotenv.load_dotenv()

# 创建B站字幕文档加载器
loader = BiliBiliLoader(
    video_urls=["https://www.bilibili.com/video/BV1g84y1R7oE/"],
    sessdata=os.getenv