AI办公自动化：根据字幕时间轴批量拆分srt文档

AIGCTribe

于 2024-06-13 07:13:01 发布

阅读量646

点赞数 19

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/AIGCTribe/article/details/139640506

版权

工作任务：要把字幕srt文档进行拆分，把数字1和16之间的提取出来，然后转成纯文本文档；

你是一个Python编程专家，要完成一个Python脚本编写任务，具体步骤如下：

读取srt文档里面的每一行："D:\My.Neighbor.Totoro.1988.720p.BluRay.X264-AMIABLE [PublicHD]\My.Neighbor.Totoro.1988.720p.BluRay.X264-AMIABLE.srt"

定位到内容为数字的那些行；

然后提取数字“{hangnumber1}”和数字“{hangnumber1}+15”之间的文本内容（{hangnumber1}从1开始，以15递增，直到608结束），删除掉所有时间轴和数字行，然后把处理后的文本内容保存为txt文档，保存在文件夹”D:\My.Neighbor.Totoro.1988.720p.BluRay.X264-AMIABLE [PublicHD]\Subs”,txt文档的格式为txt，文件名为：数字“{hangnumber1}”和数字“{hangnumber1}+15”之间的中间数；

注意：每一步都要输出信息到屏幕

注意：每一步都要输出信息到屏幕

ChatGPT生成了代码，但是运行时有一点小问题，多提取了一行内容，让ChatGPT修改：

下面是srt文档内容：

###

1

00:02:32,174 --> 00:02:34,343

Dad, do you want some candy?

2

00:02:34,426 --> 00:02:36,887

Thanks. Aren't you tired?

3

00:02:36,970 --> 00:02:38,889

- No.

- We're almost there.

4

00:02:50,609 --> 00:02:51,735

Mei, hide!

5

00:02:57,658 --> 00:02:59,076

It wasn't a policeman.

6

00:02:59,326 --> 00:03:00,869

Hello!

7

00:03:31,984 --> 00:03:34,611

Hello. Are your parents around?

8

00:03:36,863 --> 00:03:37,948

Thanks.

9

00:03:40,284 --> 00:03:43,954

I'm Kusakabe! We've just arrived!

10

00:03:45,038 --> 00:03:46,873

A pleasure to meet you!

11

00:03:47,541 --> 00:03:49,793

Welcome!

12

00:03:54,298 --> 00:03:55,382

Thank you.

13

00:04:17,696 --> 00:04:18,822

Here we are!

14

00:04:20,407 --> 00:04:21,658

Wait!

15

00:04:24,578 --> 00:04:27,122

- Mei, there's a bridge!

- A bridge?

16

00:04:32,461 --> 00:04:34,504

See that flash? Fish too!

17

00:04:35,672 --> 00:04:37,090

So, you like it here?

###

你把数字“16”和数字“17”之间的内容“See that flash? Fish too!”也提取到了数字“1”和数字“16”之间，多提取了内容，请修正这个错误。

修改后的源代码：

import os

def extract_and_save_text(srt_file, output_folder, start_line):

"""

提取 SRT 文件中指定范围的行，并保存为 TXT 文件。

:param srt_file: SRT 文件路径

:param output_folder: 输出文件夹路径

:param start_line: 起始行号

"""

end_line = start_line + 15

middle_number = (start_line + end_line) // 2

output_file = os.path.join(output_folder, f"{middle_number}.txt")

with open(srt_file, 'r', encoding='utf-8') as file:

lines = file.readlines()

text_lines = []

current_number = None

extract = False

for line in lines:

line = line.strip()

if line.isdigit():

current_number = int(line)

if start_line <= current_number < end_line:

extract = True

else:

extract = False

elif extract and '-->' not in line:

text_lines.append(line)

with open(output_file, 'w', encoding='utf-8') as file:

file.write("\n".join(text_lines))

print(f"Extracted lines {start_line}-{end_line - 1} and saved to {output_file}")

def main():

srt_file = r"D:\My.Neighbor.Totoro.1988.720p.BluRay.X264-AMIABLE [PublicHD]\My.Neighbor.Totoro.1988.720p.BluRay.X264-AMIABLE.srt"

output_folder = r"D:\My.Neighbor.Totoro.1988.720p.BluRay.X264-AMIABLE [PublicHD]\Subs"

# 确保输出文件夹存在

os.makedirs(output_folder, exist_ok=True)

# 行号范围设定

for start_line in range(1, 609, 15): # 从 1 到 608，步长为 15

extract_and_save_text(srt_file, output_folder, start_line)

if __name__ == "__main__":

main()

关注

19
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
AI办公自动化：根据字幕时间轴批量拆分srt文档

然后提取数字“{hangnumber1}”和数字“{hangnumber1}+15”之间的文本内容（{hangnumber1}从1开始，以15递增，直到608结束），删除掉所有时间轴和数字行，然后把处理后的文本内容保存为txt文档，保存在文件夹”D:\My.Neighbor.Totoro.1988.720p.BluRay.X264-AMIABLE [PublicHD]\Subs”,txt文档的格式为txt，文件名为：数字“{hangnumber1}”和数字“{hangnumber1}+15”之间的中间数；
复制链接

扫一扫

AIGCTribe CSDN认证博客专家 CSDN认证企业博客

码龄1年

417: 原创

72万+: 周排名

8377: 总排名

29万+: 访问

: 等级

7927: 积分

2332: 粉丝

3259: 获赞

31: 评论

3235: 收藏

私信

关注

热门文章

最新评论

AI办公自动化：用kimi批量将word文档部分文件名保存到Excel中
明月一帆风: 感谢分享，提示词很详细，按照您的思路能实现目标。
Coze扣子开发指南：搭建一个免费的微信公众号AI客服
m0_62196601: 阿里云AppFlow：让大模型当您的微信公众号客服，具体使用参见这篇文章（https://blog.csdn.net/m0_62196601/article/details/140286974）
AI播客下载：Edge of AI （AI最新应用场景和发展趋势）
小王毕业啦: 博主的这篇文章让我对AI播客下载这一主题有了全新的认识，通过详细的细节描写，我深刻感受到了博主的专业功底和热情。文章中涉及的AI最新应用场景和发展趋势让我受益匪浅，让我对未来的发展充满了期待。希望博主能够继续分享更多优质内容，同时也期待得到博主的指导，共同进步成长。衷心感谢博主的分享和支持！
AI播客下载：Edge of AI （AI最新应用场景和发展趋势）
小王毕业啦: 博主的文章真的让我大开眼界，对于AI播客下载的主题，博主的深度分析让我对这一领域有了更深入的了解。文章中所描述的AI最新应用场景和发展趋势，让我看到了科技的未来发展方向。博主的写作技巧非常到位，细节描写生动具体，让人读后感觉受益匪浅。希望博主能够继续分享更多有价值的内容，让更多人受益。非常感谢博主的辛勤付出和分享精神，期待与博主共同进步，共同探讨。
AI炒股：用Kimi获取美股的历史成交价格并画出股价走势图
普通网友: 写的真好，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

大家在看

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。