字幕文件srt处理之pysrt

字幕文件就是在播放视频的时候加载的用来记录显示字幕的文件。文本格式字幕的扩展名通常是 ass、srt、smi、ssa 或 sub,因为是文本格式,所以尺寸很小,通常不过百十来 KB。其中 srt 文本字幕是最流行的,因为其制作和修改非常简单:一句时间代码 + 一句字幕。

pysrt

用来进行操作字幕文件的python第三方库,把字幕文件读取为一个对象,很容易进行读取修改保存等操作。

安装以及示例

安装的方式很简单直接用pip就可以

python

pip install pysrt

示例

python

#! /usr/bin/env python
# -*- coding: utf-8 -*-#

# -------------------------------------------------------------------------------
# Name:         字幕文件读取
# Author:       yunhgu
# Date:         2021/6/29 9:53
# Description: 
# -------------------------------------------------------------------------------
import pysrt

srt = pysrt.open("srt_file.srt")
content = srt.data[0]

characters_per_second = content.characters_per_second
duration = content.duration
end = content.end
from_lines = content.from_lines
from_string = content.from_string
index = content.index
position = content.position
shift = content.shift
split_timestamps = content.split_timestamps
start = content.start
text = content.text
text_without_tags = content.text_without_tags

print(f"characters_per_second: {characters_per_second}")
print(f"duration: {duration}")
print(f"start: {start}")
print(f"end: {end}")
print(f"text: {text}")
print(f"text_without_tags: {text_without_tags}")
print(f"from_lines: {from_lines}")
print(f"from_string:{from_string}")
print(f"index: {index}")
print(f"position: {position}")
print(f"shift: {shift}")
print(f"split_timestamps: {split_timestamps}")

还有一些其他的方法,感兴趣的可以自行测试。

 

将JSON转换为SRT格式的字幕文件包括以下步骤: 1. 读取JSON文件并解析成字典格式。 2. 遍历字典,获取每个字幕的开始时间、结束时间和文本内容。 3. 将开始时间和结束时间转换为SRT格式的时间戳,格式为:hh:mm:ss,msmsms,其中msmsms为毫秒数。 4. 按照SRT格式,将时间戳、字幕内容(如果有换行符则需要替换为SRT格式的空格符)和空行依次写入SRT文件中。 下面是一个Python代码示例: ```python import json def json_to_srt(json_file, srt_file): with open(json_file, 'r') as f: data = json.load(f) with open(srt_file, 'w') as f: count = 1 for subtitle in data: start_time = format_time(subtitle['start_time']) end_time = format_time(subtitle['end_time']) text = subtitle['text'].replace('\n', '\r\n') f.write(f"{count}\n{start_time} --> {end_time}\n{text}\n\n") count += 1 def format_time(time): ms = int((time - int(time)) * 1000) time_str = time.strftime('%H:%M:%S') return f"{time_str},{ms:03}" # 示例:将json_file.json转换为srt_file.srt json_to_srt('json_file.json', 'srt_file.srt') ``` 其中,`json_file`为输入的JSON文件路径,`srt_file`为输出的SRT文件路径。函数内部使用`json.load()`函数将JSON文件解析成字典对象,遍历字典对象,获取每个字幕的开始时间、结束时间和文本内容,然后调用`format_time()`函数将时间格式化为SRT格式的时间戳,最后将时间戳、字幕内容和空行按照SRT格式写入输出文件中。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值