python删除txt指定内容_使用Python删除文本文件中的部分内容 | 学步园

为了学习英语,我把从网上下载下来的电影转换成纯MP3文件,放到iTouch里去了,这样就可以直接练习听力了,另外把下载下来的字幕也放进去,听不懂的时候可以看,但有一个问题,网上载下来的字幕格式都如下所示:700:01:44,789 --> 00:01:51,019片名:当幸福来敲门 / 追求幸福800:02:49,469 --> 00:02:52,839马上来了Should be here soo...
摘要由CSDN通过智能技术生成

为了学习英语,我把从网上下载下来的电影转换成纯MP3文件,放到iTouch里去了,这样就可以直接练习听力了,另外把下载下来的字幕也放进去,听不懂的时候可以看,但有一个问题,网上载下来的字幕格式都如下所示:

7

00:01:44,789 --> 00:01:51,019

片名:当幸福来敲门 / 追求幸福

8

00:02:49,469 --> 00:02:52,839

马上来了

Should be here soon.

9

00:03:38,819 --> 00:03:41,189

- 我想我该列个表 - 干嘛?

-I think I should make a list. -What do mean?

10

00:03:41,189 --> 00:03:43,789

- 想要的生日礼物? - 对呀

-For your birthday gifts? -Yeah.

如上,但存在两个问题:1、每一句前面都带有数字编号;2、带有时间戳;

我只想要里面的中英文文本,数字编号和时间戳都不需要。由于最近正在学习Python当然首先就想到了做个Python脚本来把时间戳和编号删掉。实现很简单,基本思路就是使用正则表达式匹配,把空行、纯数字行及带有“-->”的行删掉,然后再先回文本文件。

完成后的代码如下:

# -*- coding: utf-8 -*-

# code=cp936

import string, re

title_txt = open('I://pursuit_for_happiness(c

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值