关闭

统计文件出现最多的10个词

266人阅读 评论(0) 收藏 举报
分类:

文件words存放英文单词,格式为每行一个英文单词(单词可以重复),统计这个文件中出现次数最多的前10个单词。

cat <em>filename</em> | sort | unique -c | sort -k1,1nr | head 10

sort: 对单词进行排序
uniq -c: 显示唯一的行,并在每行行首加上本行在文件中出现的次数
sort -k1,1nr: 按照第一个字段,数值排序,且为逆序
head -10: 取前10行数据

语法

sort(选项)(参数)

来自: http://man.linuxde.net/sort

选项 

-n:依照数值的大小排序;

-r:以相反的顺序来排序;

-t<分隔字符>:指定排序时所用的栏位分隔字符; 

+<起始栏位>-<结束栏位>:以指定的栏位来排序,范围由起始栏位到结束栏位的前一栏位。

-b:忽略每行前面开始出的空格字符; 

-c:检查文件是否已经按照顺序排序;

-d:排序时,处理英文字母、数字及空格字符外,忽略其他的字符; 

-f:排序时,将小写字母视为大写字母; 

-i:排序时,除了040至176之间的ASCII字符外,忽略其他的字符; 

-m:将几个排序号的文件进行合并; 

-M:将前面3个字母依照月份的缩写进行排序;  

-o<输出文件>:将排序后的结果存入制定的文件;   

参数 

文件:指定待排序的文件列表。


0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:44306次
    • 积分:1180
    • 等级:
    • 排名:千里之外
    • 原创:74篇
    • 转载:8篇
    • 译文:1篇
    • 评论:0条