【linux命令使用】sed uniq sort使用楞严咒每个拼音使用次数计算方法

1、从www.hrfjw.com/fozhou/lengyanzhou/zhuyin.html网站下载全文注音版本,一共有5页,合并到一个网页lunyanjin2.txt

部分截图如下:

 2、使用如下两条命令分别生成所有汉字拼音和去重拼音

sed "s:<span>:\n:g" lunyanjin2.txt | sed "s:<br>:\n:g" | grep -E "^[a-z]{1,11}$" > all.txt
sed "s:<span>:\n:g" lunyanjin2.txt | sed "s:<br>:\n:g" | grep -E "^[a-z]{1,11}$"  | sort | uniq >uniq.txt
效果如下:

all.txt:

 uniq.txt:

接下来使用这个shell把每个拼音在所有拼音出现的次数统计出来:

 

 执行结果效果如下:

 这里边中间是空格,我使用notepad++把空格替换成\t,这样就可以直接拷贝到Excel进行排序了

 最后把内容复制到Excel表格,按照第二列排下序,就可以了,这样可以找到哪些拼音使用的次数最多

拼音使用次数
246
111
107
92
92
tuó89
duō85
84
62
shé60
59
56
51
jiā50
50
qié48
48
nuó46
pàn44
jiē42
ā40
38
35
35
34
jié30
30
30
nán29
suō26
25
22
22
shě22
lán21
dān20
sān19
shū19
18
18
tuō18
chēn17
zhē17
16
zhì16
shì14
zhà13
chā12
12
12
12
chá11
11
shān11
xìn11
10
pán10
9
miǎo9
qián9
8
8
shí8
7
7
shā7
tán7
7
xiě7
yào7
yōng7
zhī7
6
6
ruò6
shī6
zhě6
5
5
5
5
5
bēng4
chà4
4
fàn4
4
jiàn4
4
4
4
yìn4
zhā4
chí3
luó3
3
shuì3
téng3
yáng3
3
zhàng3
zhù3
2
chē2
chú2
duǒ2
fèi2
hàn2
jiū2
lào2
móu2
pín2
shàn2
shāng2
2
wǎng2
yǎn2
2
yīn2
2
ǎn1
bàng1
1
biàn1
bīng1
chàn1
cháng1
chì1
cuì1
dàn1
diǎn1
dié1
dīng1
dùn1
ē1
fáng1
1
1
1
1
1
jué1
1
lài1
láng1
1
lián1
liǎn1
líng1
1
lüè1
màn1
máng1
miè1
1
1
níng1
1
piáo1
1
1
1
1
sēng1
shè1
shē1
shǐ1
shù1
1
1
suǒ1
1
tiáo1
tóu1
wén1
yàng1
1
yǐn1
yīng1
zhái1
zhàn1
zhān1
zhí1
zhǔ1
zhuì1
zhuó1
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值