web访问日志分析

用途

  1. 记录访问服务器的远程主机IP地址,可以得知浏览者来自何处
  2. 记录浏览者访问web资源,可以了解网站哪些部分最受欢迎
  3. 记录浏览者使用浏览器,可以根据大多数浏览者使用浏览器对站点进行优化
  4. 记录浏览者访问时间

访问日志位置

1、Apache
在httpd.conf和引用的*.conf文件中查找CustomLog “logs/access.log” combined
说明:

a.CustomLog 访问日志配置指令
 b.logs/access.log 访问日志记录文件
 c.combined 日志格式

2\Nginx

在nginx.conf或引用的*.conf文件中查找access_log logs/access.log main
说明:

 a.access_log 访问日志配置指令
 b.logs/access.log 访问日志记录文件
 c.main 日志格式

访问日志格式

1、Apache

 LogFormat "%h %l %u %t \"%r\" %>s %b \"%{Referer}i\" \"%{User-Agent}i\"" combined
 LogFormat "%h %l %u %t \"%r\" %>s %b" common

配置说明
2、nginx

 log_format  main  '$remote_addr - $remote_user [$time_local] "$request" '
               '$status $body_bytes_sent "$http_referer" '
               '"$http_user_agent" "$http_x_forwarded_for"';

配置说明
变量说明

3、通用日志格式 common

127.0.0.1 - - [14/May/2017:12:45:29 +0800] "GET /index.html HTTP/1.1" 200 4286
远程主机IP            请求时间         时区  方法    资源      协议     状态码 发送字节       

4、组合日志格式 combined

 127.0.0.1 - - [14/May/2017:12:51:13 +0800] "GET /index.html HTTP/1.1" 200 4286 "http://127.0.0.1/" "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.116 Safari/537.36"
 远程主机IP            请求时间         时区  方法    资源      协议     状态码 发送字节    referer字符           浏览器信息

5、日志状态码
2XX:

 200: 请求成功
 201: 创建成功
 202: 接受请求
 204: 无内容

3XX:

 301: 永远重定向
 302: 临时重定向
 303: 临时重定向(HTTP1.1 同302)
 307: 临时重定向(HTTP1.1 POST方法)

4XX:

 400: 错误请求
 401: 访问拒绝
 403: 访问禁止
 404: 未找到
 405: 请求方法错误

5XX:

 500: 服务器内部错误
 503: 服务不可用
 505: 网关超时

日志统计

1、查看访问IP地址

 cat access.log|awk '{print $1}'
 cat access.log|awk '{print $1}'|sort

2、查看每个IP地址访问次数

 cat access.log|awk '{print $1}'|sort|uniq -c
 cat access.log|awk '{print $1}'|sort|uniq -c|sort -nr
 cat access.log|awk '{print $1}'|sort|uniq -c|sort -nr|head -10

3、统计总访问IP数量

 cat access.log|awk '{print $1}'|sort|uniq -c|wc -l

4、访问指定时间后的日志

 cat access.log|awk '$4>"[23/Aug/2014:23:58:00"'
 cat access.log|awk '($4>"[23/Aug/2014:23:58:00"){print $1}'
 cat access.log|awk '($4>"[23/Aug/2014:23:58:00"){print $1}'|sort|uniq -c|sort -nr

5、访问指定资源的日志

 cat access.log|awk '$7 ~/.html$/'
 cat access.log|awk '($7 ~/.html$/){print $1 " " $7 " " $9}'
 cat access.log|awk '($7 ~/.js$/){print $10 " " $7}'|sort|uniq -c|sort -nr|head -10
 cat access.log|awk '($10 > 10000 && $7 ~/.js$/){print $10 " " $7}'|sort|uniq -c|sort -nr|head -10

6、统计总流量

 cat access.log|awk '{sum+=$10}END{print sum}'
 cat access.log|awk '($7 ~/.css$/){sum+=$10}END{print sum}'
 grep "04/May/2017" access.log|awk '($7 ~/.css$/){sum+=$10}END{print sum}'

7、状态码统计

 cat access.log|awk '{print $9}' |sort|uniq -c|sort -nr
 cat access.log|awk '($9 ~/^400$/)' | wc -l
 cat access.log | awk '($4 ~/^\[04\/May\/2017/){print $9}'|sort|uniq -c|sort -nr
 cat access.log | awk '$9 ~/400/ && $4 ~/^\[04\/May\/2017/'|wc -l
 grep "04/May/2017" access.log | awk '{print $9}'|sort|uniq -c|sort -nr

原文见https://www.jianshu.com/p/01aa4785f915

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值