统计2019年6月3号,当天的PV量*
[root@shell ~]# awk '/03\/Jul\/2019/ {ip[$1]++}END{for(i in ip){sum+=ip[i]}{print sum}}' acces.log
46
统计15-19点的pv量
awk '$4>="[25/Jan/2018:15:00:00" && $4<="[25/Jan/2018:19:00:00 {print $0}"' log.bjstack.log |wc -l
统计2019年06月3日,一天内访问最多的10个IP*
[root@shell ~]# awk '/03\/Jul\/2019/ {ip[$1]++}END{for(i in ip){if ($ip[i]>10) {print $i,ip[i]}}}' acces.log|sort -rn|head
统计2018年01月25日,访问大于100次的IP*
awk '/03\/Jul\/2019/ {ip[$1]++}END{for(i in ip){if ($ip[i]>10) {print $i,ip[i]}}}' acces.log|sort -rn|head
统计2018年01月25日,访问最多的10个页面($request top 10)*
awk '/03\/Jul\/2019/ {request[$7]++}END{for (i in request){print request[i],i}}' acces.log|sort -rn|head
统计2018年01月25日,每个URL访问内容总大小($body_bytes_sent)*
awk '/25\/Jan\/2018/ {request[$7]++;size[$7]+=$10} END {for(i in request){print request[i],i,size[i]}}' log.bjstack.log |sort -rn|head
统计2018年01月25日,每个IP访问状态码数量($status)*
awk '{ip_code[$1" "$9]++}END{for (i in ip_code){print ip_code[i],i}}' acces.log |sort -rn|head
统计2018年01月25日,访问状态码为404及出现的次数($status)*
grep "404" acces.log |wc -l
awk '{if($9=="404") code[$9]++}END{for (i in code){print i,code[i]}}' acces.log
统计2018年01月25日,8:30-9:00访问状态码是404*
awk '$4>="[25/Jan/2018:15:00:00" && $4<="[25/Jan/2018:19:00:00" && $9=="404" {code[$9]++} END {for(i in code){print i,code[i]}}' log.bjstack.log
awk '$9=="404" {code[$9]++} END {for(i in code){print i,code[i]}}' log.bjstack.log
统计2018年01月25日,各种状态码数量,统计状态码出现的次数
awk '{code[$9]++} END {for(i in code){print i,code[i]}}' log.bjstack.log
awk '{if($9>=100 && $9<200) {i++} else if ($9>=200 && $9<300) {j++}else if ($9>=300 && $9<400) {k++}else if ($9>=400 && $9<500) {n++}else if($9>=500) {p++}}END{print i,j,k,n,p,i+j+k+n+p}' log.bjstack.log