python实现字幕挂载,将字幕文件与视频合并。

28 篇文章 0 订阅
19 篇文章 1 订阅

注意:这只是简单的text文本挂载,如果需要实现srt,ass字幕文件,实现字体,字体大小,背景,颜色等,最好使用ffmpeg。本人最近正在使用ffmpeg,等过段时间把源代码开放出来。

其实超简单超简单!python好现成的库,一下子省略了好多步骤!

本文在Windows环境下!linux只是不需要手动输入imagicmagick的位置!

需要用到的环境

  • python(基本上只要不是很老的就行)
  • pip(这个其实python版本>2.8.9或者>3.4的都自带了),可以通过cmd命令pip -V查询是否安装了,没有的话就输入命令

需要用到的工具:

我用的是pycharm,用来写python代码的。
Flie->setting->Project:Test->project Interpreter:
在这里插入图片描述
点击右边的+号:在搜索栏输入需要用到的三方库,然后点击install:

需要用要的三方库

  • moviepy(在上面的pycharm工具中可以直接下载或者用pip指令pip install moviepy)
  • ImageMagick(1.去官网直接下http://www.imagemagick.org/script/download.php,根据你操作系统的版本,一路next,我记得有个add to path的选项!一定要勾选,因为他自动吧安装路径添加到环境变量path中了,不然就要手动去加path了。2.我的版本是64位的,不想去官网的可以用我的百度云下载:链接:https://pan.baidu.com/s/1jmwGVsDyXf2rotkDj_qJmA密码:uc98

和上一篇下载视频一样用俩个py文件吧

一个是AddSubtitles.py(启动类):

# 使用RealizeAddSubtitles类的方法
from core.RealizeAddSubtitles import RealizeAddSubtitles

if __name__ == '__main__':
    '''调用方法示例'''
    addSubtitles = RealizeAddSubtitles('d:/python/DownLoadVideo/Fong.mp4', 'd:/python/DownLoadVideo/Love.txt')

一个是RealizeAddSubtitles.py(实现类)

from os.path import splitext, isfile

from moviepy.editor import (VideoFileClip,
                            TextClip,
                            CompositeVideoClip)


class RealizeAddSubtitles():
    '''
    合成字幕与视频
    '''
    def __init__(self, videoFile, txtFile):
        self.src_video = videoFile
        self.sentences = txtFile
        # src_video = input('请输入视频文件路径')
        # sentences = input('请输入字幕文件路径')
        if not (isfile(self.src_video) and self.src_video.endswith(('.avi', '.mp4')) and isfile(
                self.sentences) and self.sentences.endswith(
                '.txt')):
            print('视频仅支持avi以及mp4,字幕仅支持txt格式')
        else:
            video = VideoFileClip(self.src_video)
            # 获取视频的宽度和高度
            w, h = video.w, video.h
            # 所有字幕剪辑
            txts = []
            with open(self.sentences, encoding='utf-8') as fp:
                for line in fp:
                    sentences, start, span = line.split(': ')
                    start, span = map(float, (start, span))
                    txt = (TextClip(sentences, fontsize=40,
                                    font='SimHei', size=(w - 20, 40),
                                    align='center', color='white')
                           .set_position((10, h - 150))
                           .set_duration(span).set_start(start))
                    txts.append(txt)
            # 合成视频,写入文件
            video = CompositeVideoClip([video, *txts])
            fn, ext = splitext(self.src_video)
            video.write_videofile(f'{fn}_带字幕{ext}')

下面的图片是字幕文件的格式:字幕: 开始时间: 持续时间
在这里插入图片描述

如果报一个imagemagick uninstall什么的错误,原因是因为windows下的imagemagick需要手动导入。
一般在pycharm中,是在你创建的项目中有个venv->Lib->site-packages->moviepy->config_defaults.py。
将IMAGEMAGICK_BINARY后面的=号中的值手动改成你imagemagick安装的路径下的一个magick.exe。
列如:IMAGEMAGICK_BINARY = r"D:\python\ImageMagick-7.0.10-Q16-HDRI\magick.exe"

转载请指明出处!尊重劳动成果!https://blog.csdn.net/weixin_46304253/article/details/109157104

  • 2
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 8
    评论
### 回答1: 要用Python实现视频字幕提取,需要用到一些第三方库。以下是一种使用PythonFFmpeg和pytesseract的方法: 1.安装FFmpeg和pytesseract 首先需要安装FFmpeg和pytesseract。在Windows上,可以从官方网站下载FFmpeg二进制文件并将其添加到PATH环境变量中。要安装pytesseract,可以使用pip: ``` pip install pytesseract ``` 2.导入所需库 在Python中,需要导入一些库以便进行视频字幕提取。这些库包括cv2、pytesseract、numpy和subprocess。您可以使用以下代码导入这些库: ```python import cv2 import pytesseract import numpy as np import subprocess ``` 3.提取视频帧 使用OpenCV(cv2库)加载视频文件并读取每个帧。可以使用以下代码: ```python vidcap = cv2.VideoCapture('video.mp4') success,image = vidcap.read() count = 0 while success: cv2.imwrite("frame%d.jpg" % count, image) # save frame as JPEG file success,image = vidcap.read() count += 1 ``` 上面的代码将读取名为“video.mp4”的视频文件,并将其帧保存为图像文件。将其保存到当前目录下,以图像序列的形式命名为“frame0.jpg”、“frame1.jpg”等。 4.使用pytesseract提取字幕 使用pytesseract库从每个帧中提取字幕。可以使用以下代码: ```python for i in range(count): img = cv2.imread('frame%d.jpg' % i) gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) ret,thresh1 = cv2.threshold(gray,200,255,cv2.THRESH_BINARY) kernel = np.ones((1,1),np.uint8) img = cv2.dilate(thresh1,kernel,iterations = 1) img = cv2.erode(img,kernel,iterations = 1) out_below = pytesseract.image_to_string(img) print("frame ", i, " : \n") print(out_below) ``` 上面的代码将循环每个帧,将其加载为图像,将其转换为灰度图像,二值化处理,扩张和腐蚀处理以增强文本。然后,它使用pytesseract将文本从帧中提取出来,并将其打印到控制台中。 5.删除生成的图像文件 最后,需要删除生成的图像文件。可以使用以下代码: ```python for i in range(count): file = "frame%d.jpg" % i subprocess.run(['rm', file]) ``` 上面的代码将循环每个帧文件,并使用subprocess库中的rm命令删除它们。 总结 通过上述步骤,我们可以使用Python和第三方库实现视频字幕提取。您可以使用其他方法来进一步优化提取文本的过程,例如改变字幕区域的大小和位置,使用不同的图像处理技术等。 ### 回答2: 要实现视频字幕提取,可以使用Python中的一些库和工具来完成。以下是一种实现方法: 1. 安装所需库:使用Python的pip命令安装所需库,包括OpenCV、pytesseract和Pillow。 2. 导入所需库:在Python脚本中导入所需的库和模块。 3. 读取视频文件:使用OpenCV库的VideoCapture函数读取视频文件。可以使用视频文件路径作为参数,返回一个视频对象。 4. 视频处理:在循环中,逐帧读取视频,对每一帧进行处理。 5. 图像处理:将每一帧转换为灰度图像,以便于后续的文字提取和识别。 6. 提取字幕:使用pytesseract库的image_to_string函数将图像转换为文字。可以设置适当的参数,例如语言和字符集,以获取更好的结果。 7. 文字处理:对提取的文字进行必要的处理,例如去除空格、标点和其他噪音。可以使用Python的字符串操作和正则表达式来完成。 8. 字幕保存:将处理后的字幕保存到文件中,以便后续使用或分析。 9. 释放资源:在处理完成后,记得释放所有资源,包括关闭视频对象和清理内存。 10. 运行脚本:使用Python解释器运行脚本,并观察输出和保存的字幕文件。 请注意,实际实现中可能会遇到一些挑战和问题,例如视频压缩格式、字幕样式和位置的变化等。因此,根据具体情况和需求进行适当的调整和优化。 ### 回答3: 要使用Python实现视频字幕提取,可以按照以下步骤进行操作: 1. 导入所需的库:安装并导入`moviepy`库,这是一个处理视频的强大库。 2. 加载视频文件:使用`VideoFileClip`函数加载视频文件,例如`video = VideoFileClip("video.mp4")`。 3. 提取视频中的音频:使用`audio = video.audio`提取视频的音频部分。 4. 将音频转换为文字:使用语音转文本的API,如百度云、腾讯云或Google Cloud API,将音频转换为文字。调用相应的API,并传入音频文件,获得文字结果。例如,使用百度云API:`result = baidu_api.audio_to_text(audio)`。 5. 处理文字结果:根据API返回的结果,可以对文字进行处理和清洗。例如删除标点符号、过滤无关的字幕等。 6. 输出字幕:将处理后的文字结果保存为字幕文件,如SRT格式或VTT格式。可以使用库如`pysrt`或`webvtt-py`来生成字幕文件。 7. 完整代码示例: ```python from moviepy.editor import VideoFileClip import baidu_api # 假设有一个baidu_api.py文件,包含了百度云API的调用函数 # 加载视频文件 video = VideoFileClip("video.mp4") # 提取音频 audio = video.audio # 将音频转换为文字 result = baidu_api.audio_to_text(audio) # 处理文字结果 processed_text = text_processing(result) # 输出字幕文件 output_subtitles(processed_text) ``` 请注意,在实际操作中,你需要有一个有效的语音转文本的API,并将其与Python代码结合使用,以完成音频到文字的转换。
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值