php分析apache日志_php正则解析apache日志文件文件

可以把日志按小时滚动,采用php正则分析日志的方式进行解决$logLine ='127.0.0.1 - - [22/May/2015:17:09:13 +0800] "GET /sale/images/y-select.png HTTP/1.1" 200 1095';

$pattern = '/^(?P[0-9.]+) - - \[(?P[^\]]+)\]+ "GET (?P[^ ]+) HTTP\/1.[1|0|2]" (?P[0-9.]+) (?P[0-9.]+)/i';

preg_match($pattern, $log, $match);

//var_dump($match);

$ip = $match['ip'];

$time = strtotime($match['time']);

$url = $match['url'];

$status = $match['status'];

$size = $match['size'];

printf("IP:%s 访问时间:%s URL:%s 状态:%s 文件尺寸:%s",$ip,$time,$url,$status,$size);

也可是这样

运用正则表达式分隔Apache日志文件

www.MyException.Cn 网友分享于:2015-08-26 浏览:17次

使用正则表达式分隔Apache日志文件

通用日志格式的Apache日志文件示例:

127.0.0.1 - frank [10/Oct/2000:13:55:36 -0700] "GET /apache_pb.gif HTTP/1.0" 200 2326

组合日志格式的Apache日志文件示例:

127.0.0.1 - frank [10/Oct/2000:13:55:36 -0700] "GET /apache_pb.gif HTTP/1.0" 200 2326 "http://www.example.com/start.html" "Mozilla/4.08 [en] (Win98; I ;Nav)"

客户端的IP地址。

由客户端identd进程判断的RFC1413身份(identity),输出中的符号"-"表示此处的信息无效。

HTTP认证系统得到的访问该网页的客户标识(userid),如果网页没有设置密码保护,则此项将是"-"。

服务器完成请求处理时的时间。

客户的动作\请求的资源\使用的协议。

服务器返回给客户端的状态码。

返回给客户端的不包括响应头的字节数.如果没有信息返回,则此项应该是"-"。

"Referer"请求头。

"User-Agent"请求头。

用来提取信息的正则表达式组成:

^ :匹配每一行的开头。

([0-9.]+)\s :匹配IP地址。

([\w.-]+)\s :匹配identity,由数字字母下划线或点分隔符组成。

([\w.-]+)\s :匹配userid,由数字字母下划线或点分隔符组成。

(\[[^\[\]]+\])\s :匹配时间。

"((?:[^"]|\")+)"\s :匹配请求信息,双引号中可能出现转义的双引号\"。

(\d{3})\s :匹配状态码。

(\d+|-)\s :匹配响应字节数或-。

"((?:[^"]|\")+)"\s :匹配"Referer"请求头,双引号中可能出现转义的双引号\"。

"((?:[^"]|\")+)" :匹配"User-Agent"请求头,双引号中可能出现转义的双引号\"。

$ :匹配行尾。

最终的表达式如下:

^([0-9.]+)\s([\w.-]+)\s([\w.-]+)\s(\[[^\[\]]+\])\s"((?:[^"]|\")+)"\s(\d{3})\s(\d+|-)\s"((?:[^"]|\")+)"\s"((?:[^"]|\")+)"$

本文原创发布php中文网,转载请注明出处,感谢您的尊重!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值