import os
import re
# 定义匹配 <img> 标签的正则表达式
img_pattern = re.compile(r'<img.*?>', re.IGNORECASE)
# 获取当前目录下的所有文件
current_directory = os.getcwd()
files = os.listdir(current_directory)
# 遍历当前目录的所有文件
for file_name in files:
# 只处理 .txt 文件
if file_name.endswith('.txt'):
file_path = os.path.join(current_directory, file_name)
print(f"正在处理文件: {file_name}")
# 读取文件内容
with open(file_path, 'r', encoding='utf-8') as file:
content = file.read()
# 使用正则表达式删除 <img> 标签
content_without_imgs = re.sub(img_pattern, '', content)
# 去除多余的空行
new_content = os.linesep.join([line for line in content_without_imgs.splitlines() if line.strip()])
# 将修改后的内容写回文件
with open(file_path, 'w', encoding='utf-8') as file:
file.write(new_content)
print(f"文件 {file_name} 处理完成,已删除 <img> 标签并去除多余空行。\n")
转自HtTP://luosuon.com
转自HtTP://jiubud.com