一、问题描述
有时候我们需要获取txt、log、doc文件中的某些指定内容,用来做数据分析。此时可以使用python做数据处理。
二、具体样例
以读取log文件、将内容保存到txt文件为例
2.1 需求:将info.log文件中send tmp-kafka推送的内容提取出来,存到kafkaJson.txt文件中
info.log文件内容如下
2.2 python代码如下
# 打开要写入数据的txt目标文件
fileTxt = open(r'C:\Users\28687\Desktop\kafkaJson.txt', 'w')
# 打开info.log源文件
with open('E:\IDEAProjects\practise\logs\info.log', encoding='utf-8') as file:
# 读取每一行
for line in file.readlines():
# 过滤kafka推送的那行数据
if '=====>send tmp-kafka to KAFKA_DEVICE_PUSH_TOPIC' in line:
# 获取指定内容
data = line[97:]
# 打印目标数据,看效果
print(data)
# 将满足条件的内容写入文件
fileTxt.write(data)
2.3 结果
运行结果
kafkaJson.txt文件内容