linux统计txt文件中单词出现次数并排序

最新推荐文章于 2023-05-19 13:13:43 发布

风影楼c

最新推荐文章于 2023-05-19 13:13:43 发布

阅读量2.8k

点赞数 4

分类专栏： linux 文章标签： linux 统计次数文件排序 shell

本文链接：https://blog.csdn.net/qq_37684824/article/details/83819746

版权

4 篇文章 0 订阅

订阅专栏

文件：a.txt

任务：统计该文件中每一个单词出现的次数，并按照出现频率从大到小排序

sed 's/ /\n/g' "a.txt" | sort | uniq -c | sort -nr

解析：

sed替换

sed 's/被替换的字符串/新字符串/[替换选项]' filename

替换选项g表示替换文本中所有出现被替换字符串之处

uniq统计次数

uniq -c表示打印每行在文本中重复出现的次数

sort排序

-n根据数字大小进行排序

-r将排序结果逆向显示

增强版：

sed -e 's/\?//g' -e 's/ /\n/g' "test.txt" | sort | uniq -c | sort -nr

test.txt文件为：hello mylove i love you how about you do you love me?

当sed包含多个命令时，需要用-e分隔开来，第一个表示过滤掉文件中的"?"再进行计算。

输出结果为：

      3 you
      2 love
      1 mylove
      1 me
      1 i
      1 how
      1 hello
      1 do
      1 about

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注