使用Linux命令找出日志文件中访问量最大的top10 IP地址
描述
检验是否熟悉linux命令常见问题:使用 Linux命令找出日志文件中访问量最大的top10 IP地址
日志文件
日志文件test.log内容如下:
2020-07-14 07:00:00 10.11.131.1 test
2020-07-14 07:00:00 10.11.131.2 test
2020-07-14 07:00:00 10.11.131.2 test
2020-07-14 07:00:00 10.11.131.3 test
2020-07-14 07:00:00 10.11.131.3 test
2020-07-14 07:00:00 10.11.131.3 test
2020-07-14 07:00:00 10.11.131.3 test
2020-07-14 07:00:00 10.11.131.6 test
2020-07-14 07:00:00 10.11.131.6 test
2020-07-14 07:00:00 10.11.131.6 test
2020-07-14 07:00:00 10.11.131.6 test
2020-07-14 07:00:00 10.11.131.8 test
2020-07-14 07:00:00 10.11.131.8 test
2020-07-14 07:00:00 10.11.131.8 test
2020-07-14 07:00:00 10.11.131.8 test
2020-07-14 07:00:00 10.11.131.8 test
2020-07-14 07:00:00 10.11.131.8 test
2020-07-14 07:00:00 10.11.131.8 test
2020-07-14 07:00:00 10.11.131.8 test
linux命令
cat test.log|awk -F " " '{print $3}'|sort|uniq -c|sort -nrk 1|awk -F " " '{print $2}'|head -10
输出结果如下:
10.11.131.8
10.11.131.6
10.11.131.3
10.11.131.2
10.11.131.1
linux命令详解
1.cat *.log将文本内容打印到屏幕
2.使用awk命令可以按照分割符将一行分割为多个列,第一列用$1表示,第二列用$2表示,依次类推
awk -F" " '{print $3} //表示用空格作为分隔符进行分割,打印出第3列
3.sort 进行排序,默认是按照ascii码进行排序的
4.uniq -c 统计相邻的行的重复数量,结果是类似 3 127.13.13.13,前面的数字代码重复的行数
sort|uniq -c //统计重复的行数
5.sort -n是按照数值进行由小到大进行排序, -r是表示逆序,-k是执行按照第几列进行排序
sort -nrk 1
6.使用awk命令可以按照分割符将一行分割为多个列,第一列用$1表示,第二列用$2表示,依次类推
awk -F" " ‘{print $2}’ //表示用空格作为分隔符进行分割,打印出第2列
7.head -n表示取前n个
head -10
引用:
1.https://www.cnblogs.com/zhaijing/p/9767285.html