python清理img标签应该怎么写

import os
import re

# 定义匹配 <img> 标签的正则表达式
img_pattern = re.compile(r'<img.*?>', re.IGNORECASE)

# 获取当前目录下的所有文件
current_directory = os.getcwd()
files = os.listdir(current_directory)

# 遍历当前目录的所有文件
for file_name in files:
    # 只处理 .txt 文件
    if file_name.endswith('.txt'):
        file_path = os.path.join(current_directory, file_name)
        print(f"正在处理文件: {file_name}")

        # 读取文件内容
        with open(file_path, 'r', encoding='utf-8') as file:
            content = file.read()

        # 使用正则表达式删除 <img> 标签
        content_without_imgs = re.sub(img_pattern, '', content)

        # 去除多余的空行
        new_content = os.linesep.join([line for line in content_without_imgs.splitlines() if line.strip()])

        # 将修改后的内容写回文件
        with open(file_path, 'w', encoding='utf-8') as file:
            file.write(new_content)

        print(f"文件 {file_name} 处理完成,已删除 <img> 标签并去除多余空行。\n")
 

转自HtTP://luosuon.com
转自HtTP://jiubud.com

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值