统计特定文件中的词频

最新推荐文章于 2020-04-13 21:31:29 发布

还要来吗

最新推荐文章于 2020-04-13 21:31:29 发布

阅读量236

点赞数

本文链接：https://blog.csdn.net/yffhhffv/article/details/84195046

版权

分享一下我老师大神的人工智能教程！零基础，通俗易懂！http://blog.csdn.net/jiangjunshow

也欢迎大家转载本篇文章。分享知识，造福人民，实现我们中华民族伟大复兴！

查找文件中使用的单词的频率是一件很有意思的事情，下面，我们利用关联数组，awk，sed，grep 等不同的方式来解决问题。

首先，我们需要一个测试用的文本，保存名为 word.txt

内容如下：

Word usedthis  countingthis

接下来需要编写Shell脚本程序，如下所示：

#!/bin/bash#Name: word_freq.sh#Description: Find out frequency of words in a fileif [ $# -ne 1 ];then echo "Usage: $0 filename"; exit -1fifilename=$1egrep -o "\b[[:alpha:]]+\b" $filename | \awk '{ count[$0]++ } END{ printf("%-14s%s\n","Word","Count") ; \ for(ind in count) { printf("%-14s%d\n",ind,count[ind]); } }'