关于视频字幕(有无外挂字幕)的提取死磕一天的总结

2021.03.12 关于视频字幕(有无外挂字幕)的提取死磕一天的总结

概述:


①有外挂字幕
---->视频网页
---->F12---->nework
----->打开字幕
---->找到.json文件
---->跑一下下面脚本就可以了

②硬字幕:无外挂字幕
---->下载视频
---->下载esrXP、格式工厂(分割)
---->视频导入esrxp设置区域
---->导出OCR影像


问题描述:

密码学双语,外教语速之快。。。5分钟暂停后退无数次:印证无比真实评论区
在这里插入图片描述


一、外挂字幕

没有外挂字幕的视频……字幕怎么导出

找了无数教程,都是提取外挂字幕:
在这里插入图片描述

F12—刷新—clear—打开CC字幕—json文件
在这里插入图片描述

在这里插入图片描述
参考https://www.jianshu.com/p/66450e9554f8

# -- coding: utf-8 --

import json
import math
import os

def convert_json_to_srt(json_files_path):    
    json_files = os.listdir(json_files_path)
    srt_files_path = os.path.join(json_files_path, 'srt') #更改后缀后字幕文件的路径    
    isExists = os.path.exists(srt_files_path)
    if not isExists:
        os.mkdir(srt_files_path)
    
    for json_file in json_files:        
        file_name = json_file.replace(json_file[-5:], '.srt') #改变转换后字幕的后缀
        file = ''  # 这个变量用来保存数据
        i = 1
        # 将此处文件位置进行修改,加上utf-8是为了避免处理中文时报错
        with open(os.path.join(json_files_path, json_file), encoding='utf-8') as f:
            datas = json.load(f)# 加载文件数据
            f.close()
                    
        for data in datas['body']:
            start = data['from']  # 获取开始时间
            stop = data['to']  # 获取结束时间
            content = data['content']  # 获取字幕内容
            file += '{}\n'.format(i)  # 加入序号
            hour = math.floor(start) // 3600
            minute = (math.floor(start) - hour * 3600) // 60
            sec = math.floor(start) - hour * 3600 - minute * 60
            minisec = int(math.modf(start)[0] * 100)  # 处理开始时间
            file += str(hour).zfill(2) + ':' + str(minute).zfill(2) + ':' + str(sec).zfill(2) + ',' + str(minisec).zfill(2)  # 将数字填充0并按照格式写入
            file += ' --> '
            hour = math.floor(stop) // 3600
            minute = (math.floor(stop) - hour * 3600) // 60
            sec = math.floor(stop) - hour * 3600 - minute * 60
            minisec = abs(int(math.modf(stop)[0] * 100 - 1))  # 此处减1是为了防止两个字幕同时出现
            file += str(hour).zfill(2) + ':' + str(minute).zfill(2) + ':' + str(sec).zfill(2) + ',' + str(minisec).zfill(2)
            file += '\n' + content + '\n\n'  # 加入字幕文字
            i += 1
        with open(os.path.join(srt_files_path, file_name), 'w', encoding='utf-8') as f:
            f.write(file)  # 将数据写入文件
                        
if __name__ == '__main__':   
    json_folder_path = 'D:\\video\\化学视频\\test\\src' #json字幕文件的路径(注意路径的格式)
    convert_json_to_srt(json_folder_path)

二、硬字幕

在这里插入图片描述

1. 下载esrXP

解决了讨厌的MCFee禁止下载的exe文件或者直接删除(无语子
找了无数教程
在这里插入图片描述
在这里插入图片描述
附上esrXP操作链接:https://docs.qq.com/doc/Bhq4pp0zdjAE3T5Lb54fHXne21rEQt3brULE4?undefined

2. 转换格式

试了很长时间esrXP导入视频没有响应,挨个尝试MP4、avi、rmvb。
看教程说大小限制,下载了格式工厂,分割60M的视频
……沧桑几个小时后……
导入成功
下载格式工厂,导入视频
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

3. 用esrXP过滤字幕

过滤器设置中,调整字幕颜色、边框颜色的设置

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • 4
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值