linux shell对文本的处理相当强大,通常几条简单的命令就能实现高级语言很多代码才能实现的功能。以下是查找文本中n个出现频率最高的单词的脚本。
1 #! /bin/bash
2
3 cat "$1" |
4 tr -cs '[a-z][A-Z]' '[\012*]' |
5 tr 'A-Z' 'a-z' |
6 sort |
7 uniq -c |
8 sort -k1nr -k2 |
9 head -n "$2"
运行脚本,其中第一个参数是待查找的文本文件,第二个参数是n的值。