python过滤文件内容_python中将正则过滤的内容输出写入到文件中的实例

该篇博客介绍了如何利用Python进行正则表达式匹配,从Apache日志access_test.log中筛选特定内容,并将过滤后的结果写入到20160205.txt文件。主要涉及日志解析、IP地址、时间戳、URL、状态码和流量的提取。
摘要由CSDN通过智能技术生成

处理过滤Apache日志文件

access_test.log文件内容

27.19.74.143 - - [30/May/2015:17:38:21 +0800] "GET /static/image/smiley/default/sleepy.gif HTTP/1.1" 200 2375

8.35.201.164 - - [30/May/2015:17:38:21 +0800] "GET /static/image/common/pn.png HTTP/1.1" 200 592

过滤目标

60.166.12.170 31/May/2013:00:00:02 /forum.php 200 45780

处理后将内容写入到文件20160205.txt

#!/usr/bin/env python

# - coding:utf - 8 -*-

import re,sys

with open('access_test.log') as f:

for line in f:

parseip = re.search(r'(.*?) - - ', line)

parsetime = re.search(r'

(.∗?)

(.∗?)

', line)

parseurl = re.search(r' "\w+ (.*?) HTTP/', line)

parsestatus = re.search(r' HTTP/(.*?)" (.*?) ', line)

parseTraffic = re.search(r'\d+ \d+', line)

if parseip and parsetime and parseurl and parsestatus and parseTraffic is None:

continue

output=sys.stdout

outputfile=open('20160205.txt','a')

sys.stdout=outputfile

print parseip.group(1).split('?')[0] + '\t' + parsetime.group(1).split('?')[0] + '\t' + parseurl.group(1).split('?')[0] + '\t' + parsestatus.group(2) + '\t' + parseTraffic.group(0).split(' ')[1]

outputfile.close()

sys.stdout=output

import sys

然后在打算把输出数据写入文件的代码之前加上以下代码

output=sys.stdout

outputfile=open(filename,'w')

sys.stdout=outputfile

上面的filename表示输出文件

程序结束或恢复成正常输出时加上以下代码

outputfile.close()

sys.stdout=output

恢复输出为开始保存的正常输出值

以上这篇python中将正则过滤的内容输出写入到文件中的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值