最新版pyvideotrans3.46整合包，将视频从一种语言翻译为另一种语言，同时支持语音识别转录、语音合成、字幕翻译，AI自动视频翻译配音加字幕软件，解压即用

struggle2025

已于 2025-01-29 16:55:36 修改

阅读量2.2k

点赞数 42

文章标签：人工智能语音识别机器学习自然语言处理语言模型

于 2025-01-29 16:50:41 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/struggle2025/article/details/145393844

版权

一、pyvideotrans3.46介绍（文末提供下载）

官方地址：GitHub - jianchang512/pyvideotrans: Translate the video from one language to another and add dubbing. 将视频从一种语言翻译为另一种语言，同时支持语音识别转录、语音合成、字幕翻译。

本文信息以及图片来源于开源官方地址

这是一个视频翻译配音工具，可将一种语言的视频翻译为指定语言的视频，自动生成和添加该语言的字幕和配音。并支持API调用

语音识别支持 faster-whisper和openai-whisper本地离线模型及 OpenAI SpeechToText API GoogleSpeech 阿里中文语音识别模型和豆包模型，并支持自定义语音识别api.

文字翻译支持 微软翻译|Google翻译|百度翻译|腾讯翻译|ChatGPT|AzureAI|Gemini|DeepL|DeepLX|字节火山|离线翻译OTT

文字合成语音支持 Microsoft Edge tts Google tts Azure AI TTS Openai TTS Elevenlabs TTS 自定义TTS服务器api GPT-SoVITS clone-voice ChatTTS-ui Fish TTS CosyVoice

允许保留背景伴奏音乐等(基于uvr5)

支持的语言：中文简繁、英语、韩语、日语、俄语、法语、德语、意大利语、西班牙语、葡萄牙语、越南语、泰国语、阿拉伯语、土耳其语、匈牙利语、印度语、乌克兰语、哈萨克语、印尼语、马来语、捷克语、波兰语、荷兰语、瑞典语/其他语言可选自动检测

二、主要用途和功能

【自动翻译视频并配音】将视频中的声音翻译为另一种语言的配音，并嵌入该语言字幕

【语音识别/将音频视频转为字幕】可批量将音频、视频文件中的人类说话声，识别为文字并导出为srt字幕文件

【语音合成/字幕配音】根据本地已有的srt字幕文件创建配音，支持单个或批量字幕

【翻译字幕文件】将一个或多个srt字幕文件翻译为其他语言的字幕文件

【合并视频和音频】批量将视频文件和音频文件一一对应合并

【合并视频和srt字幕】批量将视频文件srt字幕文件一一对应合并

【为视频添加图片水印】批量将视频文件中嵌入图片水印

【从视频中提取音频】从视频中分离为音频文件和无声视频

【音频视频格式转换】批量将音频视频进行格式转换

【字幕编辑并导出多格式】支持导入srt、vtt、ass格式字幕，编辑后可设置字体样式、色彩等导出对应格式字幕

【字幕格式转换】批量将字幕文件进行 srt/ass/vtt 格式互转

【下载油管视频】可从youtube上下载视频

【人声背景乐分离】

【API调用】支持语音合成、语言识别、字幕翻译、视频翻译接口调用

三、下载安装

打包版本(仅win10/win11可用）

[点击去下载预打包版,解压到无空格的英文目录，双击 sp.exe
解压到英文路径下，并且路径中不含有空格。解压后双击 sp.exe (若遇到权限问题可右键使用管理员权限打开)
注意：必须解压后使用，不可直接压缩包内双击使用，也不可解压后移动sp.exe文件到其他位置

下载文件说明（文末提供下载）：

win-videotrans-v3.46-tiny.7z Win v3.46 完整包下载，直接解压运行就可以用了

win-PatchUpdate-3.46.7z v3.46 补丁包（如果已安装过3.x版本，可下载补丁包后解压在sp.exe所在目录，覆盖已有sp.exe和文件夹，补丁覆盖后打开提示需下载完整包，请升级显卡驱动、升级cuda到12.x、升级cudnn到cudnn9，并重新下载完整包）

api.exe 下载，api.exe是用于通过http请求调用的文件，不可独立使用，需先下载完整包，然后下载api.exe和 sp.exe放在同一目录下

为避免压缩包体积过大，打包版只内置最小模型 tiny，识别效果不佳，效果更好的模型请到下面的链接自行下载，建议至少使用medium模型，推荐large-v2

模型下载链接

Release download all models-下载所有语音识别模型 · jianchang512/stt · GitHub

文件都打包在一起了，下载链接：

夸克网盘分享

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。