P117
#!/bin/sh
# 从标准输入读取文本流,再输出出现频率最高的前n(默认值:25)个单词的列表
# 附上出现频率的计数,按照这个计数由大而小排列
# 输出到标准输出。
#
# Argument:
# wf[n]
tr -cs A-Za-z\' '\n' |
tr A-Z a-z |
sort |
uniq -c |
sort -k1,1nr -k2 |
sed ${1:-25}q
『感想』该该脚本不能区分有前缀的单词,比如book,book-stealer,用该脚本会认为是book出现了两次
########################## 修改之后 ############################
#!/bin/sh
# 从标准输入读取文本流,再输出出现频率最高的前n(默认值:25)个单词的列表
# 附上出现频率的计数,按照这个计数由大而小排列
# 输出到标准输出。
#
# Argument:
# wf[n]
sed 's/ /\n/g' | #实际上只改了这一个地方,便可以实现单词前缀的识别
tr A-Z a-z |
sort |
uniq -c |
sort -k1,1nr -k2 |
sed ${1:-25}q