目的:txt文档中的内容;含有姓名和手机号,想要提取出来,保存到Excel中。
txt文档的内容如:
python代码:
import re
import pandas as pd
# 读取TXT文件内容
with open(r'C:/RJ/42.txt', 'r', encoding='utf-8') as f:
content = f.readlines()
# 查找关键词'姓名'和'手机号'
name_pattern = re.compile(r'"姓名":"(.*?)"')
phone_pattern = re.compile(r'"手机号":"(.*?)"')
# 获取关键词'姓名'后的姓名和关键词'手机号'后的手机号
names = [name_pattern.search(line).group(1) for line in content if name_pattern.search(line)]
phones = [phone_pattern.search(line).group(1) for line in content if phone_pattern.search(line)]
# 将获取的数据保持到excel中
df = pd.DataFrame({'姓名': names, '手机号': phones})
df.to_excel(r'C:/RJ/42.xlsx', index=False)