linux字符串第一个字母排序,如何用shell脚本实现单词及字母去重排序?

在linux中处理文件的命令有sed、awk、grep、tr等,而对于去重复排序的命令有sort、uniq等,在处理文件时首先要考虑的是文本的结构是否存在规律。

问题中是需要对单词及字母进行排序,这里需要考虑的问题是单词中是否存在大写字母?单词是否和标点符号连接?

如果需要统计排序的是字符串,我们可以使用下面的命令。

[root@api ~]# echo ${str,,}|sed 's/[^a-z]/ /g'|tr ' ' '\n'|sort|uniq -c|sort -nk1 -r

如果需要统计的是文件,我们可以这个命令。

[root@api ~]# cat file|tr '[A-Z]' '[a-z]'|sed 's/[^a-z]/ /g'|tr ' ' '\n'|sort|uniq -c|sort -nk1 -r

185029fab414cb422f30aa7b4805701f.png

管道【|】,可以将上一个命令的输出做为管道后面命令的输入,从上面的命令就很好的看出了每一步管道符号的作用。

下面解释下每一个处理的命令。

#echo ${a,,}

49b5fcf669841d13378ce8fdc456cbad.png

在bash 4+ 版本以后字符串本身就可以完成大小写转换。

#echo ${str^^}

03202a6dbc9d5778c7d1e8959719e953.png

同样也可以使用tr命令来替换大小写字母,比如:

#echo xxxx | tr '[a-z]' '[A-Z]'

#echo XXX | tr '[A-Z]' '[a-z]'

sed 命令是高效处理文本的工具,通过管道符号,可以不用输入后面的filename,这里的意思是,替换非字母的其他字符为空:

^:意思是非a-z的其他字符

#sed 's/[^a-z]/ /g' filename

在删除了字符之后,就需要统计单词和排序了,sort和uniq命令一般是使用行来统计的,这里我们需要将字符串或者文件中的单词,按照每行一个单词来输入出。可以使用tr命令将文本中的空格替换成换行符:

#echo 'xxx xx xx11'|tr ' ' '\n'

5eaa006256a07b810fe148b3fa2a3d39.png

从上面的输出中,可以看到将字符串按照每行来输出,但是出现了空行,可以使用

#echo 'xxx xx xx11'|tr ' ' '\n'|tr -s '\n'

在上面的命令中sort命令出现两次,第一次是对输出的字符串进行排序,第二次是按照第一列的数字进行降序排列。而uniq -c 是为了统计每一行出现的次数。

#echo 1 1 2 3 4 |tr ' ' '\n'|sort |uniq -c|sort -nk1 -r

2 1

1 4

1 3

1 2

匹配单个字母可以使用grep命令:

[root@api sudo-1.8.27]# echo 'as;df?g,,;;asd;f'|grep -o "[a-z]" |sort|uniq -c |sort -nk1 -r

2 s

2 f

2 d

2 a

1 g

grep -o 【-o 表示“only-matching”】仅匹配这里只匹配a-z的字母。在使用sort和uniq命令进行排序处理。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值