文件名:readme
简要思路:
1.去除标点符号和数字
2.以空格为分隔符,按行读取单词,一单词一行输出
3.排序
4.按单词计算出现次数
5.按出现次数排序
方法1:
sed 's/[0-9.,<>//:()-]/ /g' readme |sed 's/\"//g' | awk '{for (i=1;i<=NF;i++){print $i;}}'|sort -r|uniq -c | sort -nr
方法2:
使用read line循环,按行处理并输出
#!/bin/bash
> tmp.txt
while read line
do
echo $line | sed 's/[0-9.,<>//:()-]/ /g' |sed 's/\"//g' | awk '{for (i=1;i<=NF;i++){print $i >> "tmp.txt";}}'
done < readme
cat tmp.txt | sort |uniq -c |sort -nr