v2.0
用Python读取srt文件,把说话人,开始时间,结束时间,持续时间,和对应的文本作为Excel的标题,读取srt数据提取这些信息保存到Excel。pysrt 是一个用于处理、修改和创建字幕文件的Python库,用这个库实现
import pysrt
import pandas as pd
def extract_srt_data_to_excel(srt_file):
# 打开SRT文件并解析
srt_data = pysrt.open(srt_file)
# 创建一个空的数据框架来存储提取的数据
df = pd.DataFrame(columns=['开始时间(分钟)', '结束时间(分钟)', '持续时间(秒)', '文本'])
# 遍历字幕列表,提取所需信息
for subtitle in srt_data:
# 开始时间和结束时间可以直接从字幕对象中获取
start_time_ms = subtitle.start.ordinal
end_time_ms = subtitle.end.ordinal
# 计算开始时间和结束时间(秒)
start_time_s = start_time_ms / 1000.0
end_time_s = end_time_ms / 1000.0
# 计算开始时间和结束时间(分钟)
start_time_min = start_time_s / 60.0
end_time_min = end_time_s / 60.0
# 文本