卡卡字幕助手（VideoCaptioner）使用教程

最新推荐文章于 2025-04-26 09:30:00 发布

尚学红Vandal

最新推荐文章于 2025-04-26 09:30:00 发布

阅读量719

点赞数 5

本文链接：https://blog.csdn.net/gitblog_00953/article/details/146560019

版权

卡卡字幕助手（VideoCaptioner）使用教程

VideoCaptioner 🎬 卡卡字幕助手 | VideoCaptioner - 基于 LLM 的智能字幕助手，无需GPU一键高质量字幕视频合成！视频字幕生成、断句、校正、字幕翻译全流程。让字幕制作简单高效！项目地址: https://gitcode.com/gh_mirrors/vi/VideoCaptioner

1. 项目介绍

卡卡字幕助手（VideoCaptioner）是一款基于大语言模型（LLM）的视频字幕处理助手。它支持语音识别、字幕断句、优化、翻译等全流程处理，能够为视频配上效果惊艳的字幕。项目旨在提供一种简单且无需高配置的方法，通过利用大语言模型进行字幕智能断句、校正、翻译，实现视频字幕的一键处理。

2. 项目快速启动

Windows 用户

从 Release 页面下载最新版本的可执行程序。
打开安装包进行安装。
配置LLM API（用于字幕断句、校正），可使用本项目的中转站。
翻译配置，选择是否启用翻译，默认使用微软翻译。
语音识别配置，默认使用B接口，中英以外的语言请使用本地转录。
拖拽视频文件到软件窗口，即可全自动处理。

MacOS 用户

由于项目作者缺少Mac测试环境，暂无法提供MacOS的可执行程序。Mac用户请自行使用下载源码和安装python依赖运行。

git clone https://github.com/WEIFENG2333/VideoCaptioner.git
cd VideoCaptioner
python3 -m venv venv
source venv/bin/activate
pip install -r requirements.txt
python main.py

Docker 部署（beta）

克隆项目

git clone https://github.com/WEIFENG2333/VideoCaptioner.git
cd VideoCaptioner

构建镜像

docker build -t video-captioner .

运行容器

docker run -d \
-p 8501:8501 \
-v $(pwd)/temp:/app/temp \
-e OPENAI_BASE_URL="你的API地址" \
-e OPENAI_API_KEY="你的API密钥" \
--name video-captioner \
video-captioner