我们来看看a.txt文件:
taoge@localhost Desktop> cat a.txt
123
456
1111
456
123
123
1
2
3
taoge@localhost Desktop>
先对其排序(按串排序):
taoge@localhost Desktop> cat a.txt | sort
1
1111
123
123
123
2
3
456
456
taoge@localhost Desktop>
再进行聚合:
taoge@localhost Desktop> cat a.txt | sort | uniq -c
1 1
1 1111
3 123
1 2
1 3
2 456
taoge@localhost Desktop>
聚合后得到频次, 最后对频次进行排序(r表示逆向排序, n表示按数值排序, k表示按第k列进行排序):
taoge@localhost Desktop> cat a.txt |sort | uniq -c | sort -rnk 1
3 123
2 456
1 3
1 2
1 1111
1 1
taoge@localhost Desktop>
爽爽哒。 在后台开发中, 经常要涉及到数据统计, 如上命令真是利器啊!