Linux 常用统计命令
排序:sort
sort常用参数:
-b 忽略开头的空白字符
-f 将小写字母看做大写字母
-h 根据存储量容量排序(KB、MB、GB)
-o 把结果写入文件
-r 以相反的顺序来排序
-t 指定分隔符 . 默认为空格
-V按数字版本排序
-k指定排序的关键字,与-t参数配合使用
eg:
cat sort_t | sort -t . -k 1
sort_t 文件名
sort -t . -k 1 sort 的-k与-t参数配合使用,以第一个.为指定的关键字
去除重复:uniq
uniq常用参数(只检查上下行是否重复):
-c 统计重复出现的次数
-d 所有邻近的重复行只被打印一次(重复次数>=2)
-D 所有邻近的重复行将全部打印
-f 跳过对前n个列的比较
-s 跳过对前n个字符的比较
-w 只对每行前n个字符进行比较
eg:
cat uniq_demo.txt | sort -k 3 | uniq -c -f 2 |sort -k 1 -nr
uniq_demo.txt文件名
sort -k 3 对第三个空格后的字段排序
uniq -c -f 2 跳过对前两个字段的比较进行排序,并统计重复出现次数
sort -k 1 -nr 按第一个字段、以数字的顺序、从大到小排列
字符统计:wc
wc常用参数
-c 统计字节数:chars
-l 统计行数
-w 统计单词数
-L 打印最长行的长度
cat wc_demo.txt | wc -c
统计文件wc_demo.txt的字节数。