一、pyvideotrans3.46介绍(文末提供下载)
本文信息以及图片来源于开源官方地址
这是一个视频翻译配音工具,可将一种语言的视频翻译为指定语言的视频,自动生成和添加该语言的字幕和配音。并支持API调用
语音识别支持 faster-whisper
和openai-whisper
本地离线模型 及 OpenAI SpeechToText API
GoogleSpeech
阿里中文语音识别模型
和豆包模型,并支持自定义语音识别api.
文字翻译支持 微软翻译|Google翻译|百度翻译|腾讯翻译|ChatGPT|AzureAI|Gemini|DeepL|DeepLX|字节火山|离线翻译OTT
文字合成语音支持 Microsoft Edge tts
Google tts
Azure AI TTS
Openai TTS
Elevenlabs TTS
自定义TTS服务器api
GPT-SoVITS
clone-voice ChatTTS-ui Fish TTS CosyVoice
允许保留背景伴奏音乐等(基于uvr5)
支持的语言:中文简繁、英语、韩语、日语、俄语、法语、德语、意大利语、西班牙语、葡萄牙语、越南语、泰国语、阿拉伯语、土耳其语、匈牙利语、印度语、乌克兰语、哈萨克语、印尼语、马来语、捷克语、波兰语、荷兰语、瑞典语/其他语言可选自动检测
二、主要用途和功能
【自动翻译视频并配音】将视频中的声音翻译为另一种语言的配音,并嵌入该语言字幕
【语音识别/将音频视频转为字幕】可批量将音频、视频文件中的人类说话声,识别为文字并导出为srt字幕文件
【语音合成/字幕配音】根据本地已有的srt字幕文件创建配音,支持单个或批量字幕
【翻译字幕文件】将一个或多个srt字幕文件翻译为其他语言的字幕文件
【合并视频和音频】批量将视频文件和音频文件一一对应合并
【合并视频和srt字幕】批量将视频文件srt字幕文件一一对应合并
【为视频添加图片水印】批量将视频文件中嵌入图片水印
【从视频中提取音频】从视频中分离为音频文件和无声视频
【音频视频格式转换】批量将音频视频进行格式转换
【字幕编辑并导出多格式】支持导入srt、vtt、ass格式字幕,编辑后可设置字体样式、色彩等导出对应格式字幕
【字幕格式转换】批量将字幕文件进行 srt/ass/vtt 格式互转
【下载油管视频】可从youtube上下载视频
【人声背景乐分离】
【API调用】支持 语音合成、语言识别、字幕翻译、视频翻译接口调用
三、下载安装
打包版本(仅win10/win11可用)
-
[点击去下载预打包版,解压到无空格的英文目录,双击 sp.exe
-
解压到英文路径下,并且路径中不含有空格。解压后双击 sp.exe (若遇到权限问题可右键使用管理员权限打开)
-
注意:必须解压后使用,不可直接压缩包内双击使用,也不可解压后移动sp.exe文件到其他位置
下载文件说明(文末提供下载):
win-videotrans-v3.46-tiny.7z Win v3.46 完整包下载,直接解压运行就可以用了
win-PatchUpdate-3.46.7z v3.46 补丁包 (如果已安装过3.x版本,可下载补丁包后解压在sp.exe所在目录,覆盖已有sp.exe和文件夹,补丁覆盖后打开提示需下载完整包
,请升级显卡驱动、升级cuda到12.x、升级cudnn到cudnn9,并重新下载完整包)
api.exe 下载,api.exe是用于通过http请求调用的文件,不可独立使用,需先下载完整包,然后下载api.exe和 sp.exe放在同一目录下
为避免压缩包体积过大,打包版只内置最小模型 tiny,识别效果不佳,效果更好的模型请到下面的链接自行下载 ,建议至少使用medium模型,推荐large-v2
模型下载链接
Release download all models-下载所有语音识别模型 · jianchang512/stt · GitHub
文件都打包在一起了,下载链接: