数据频次统计与排序
给定一个记录命令的data1
数据文件,统计出其中频次最高的前3个命令:
cat data1
查看文件:
显示行号和具体的命令,从中可以看出从第8个字符开始是命令,于是cat data1 | cut -c 8-
截取每一行从第8个字符开始的数据:
由此得到初步的数据,然后打印出重复的行并统计出现的次数,uniq
的-d
参数(duplicate)和-c
参数(count),但是要先排序,因为uniq命令只对相邻的行起作用,cat data1 | cut -c 8- | sort | uniq -dc
:
然后再排序,按照数字大小排序,逆序cat data1 | cut -c 8- | sort | uniq -dc | sort -rn
:
最后只需要取前3个就可以了,cat data1 | cut -c 8- | sort | uniq -dc | sort -rn | head -3
: