首先先停止摸鱼
然后放上nginx日志的格式:
注:看需求,先分别过滤出GET和POST请求(因为命令是重复的,只有关键词不一样,文件名称,所以就关于POST的部分就不打出来了)
1.这里使用sort -u去重,相同时间的相同访问视为无效请求
grep "GET" access.log-20210701 |sort -u > get_0701.txt
2.$7对应的是参数部分,将该请求以及请求次数给计算出来存到临时文件bb.txt(没什么含义,随便打的)
awk '{a[$7]++}END{for(i in a){print i,a[i]}}' get_0701.txt > bb.txt
输出的信息是这样的:(发现已经过滤出了请求和请求数)
tail -10 bb.txt
3.因为比较乱,而且低于10的请求没有参考价值,决定再过滤一遍
awk '{if ($2>=10)print}' bb.txt > get_0701_parameter.txt
然后查看最后需要的信息
head -10 get_0701_parameter.txt
搞定,将文件交差。