linux统计一个文件中某个字符串的个数[grep/awk/tr]

最新推荐文章于 2024-08-21 15:23:24 发布

红桃xin

最新推荐文章于 2024-08-21 15:23:24 发布

阅读量4.9k

点赞数 1

分类专栏： linux 文章标签： bash linux 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u011993094/article/details/121947009

版权

linux 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

本文介绍了如何利用grep的-o和-c选项，awk的RS变量，以及tr命令的-c和-d选项来统计文件中特定字符串的出现次数。通过实例展示了在Linux环境下，不同命令的使用技巧和统计效果，帮助理解各种命令的功能和应用场景。

摘要由CSDN通过智能技术生成

统计一个文件中某个字符串的个数，其实就是在在一块沙地里面找石头，有的人看到石头以后，在上面做个标记（grep），然后记住自己做了多少个标记；有的
人看到石头以后，把它挖了（tr），最后统计自己挖了多少石头；有的人看到石头以后，把它跳过去（awk），然后统计自己跳了多少次。
这是我用的的文件

[root@bzhou test]# cat file
hafsdha
hahafsdfsdhaha
haha

我想匹配的是‘haha’这个字符串

1.grep的-o选项

[root@bzhou test]# grep -c 'haha' file
2

最开始的时候是用-c这个选项，不过-c只能统计一行的，如果一行里面有多个匹配的字符串，那-c就无能为力了。
这个是正确的

[root@bzhou test]# grep -o 'haha' file | wc -l
3

2. awk

这个东西要感谢CU上的blackold。

[root@bzhou test]# awk -v RS='haha' 'END {print --NR}' file

-v 去设定一个变量的值，RS是记录的分隔符，默认的是新行(\n)，就是说awk按照一行一行读数据，但是现在RS为’haha’后，就按’haha’读数据了，NR为已读的记录数，n个记录是被n-1个分隔符分开的，所以就是–NR了。

3.tr

严格意义上说，tr匹配不了字符串，只能去匹配单个字符。这里就匹配这个文件中‘h’的个数。

[root@bzhou test]# tr -cd 'h' <file | wc -c
8
[root@bzhou test]# grep -o 'h' file | wc -l
8

-d可以删除某个字符，如果只有-d就会输出删除特定字符后的字符串，但是-c可以反显，这就是显示了被删除的字符。然后可以用wc -c去统计下字符的个数。
这是在CU上面的文章，我其实就是个搬运工罢了。
http://bbs2.chinaunix.net/viewthread.php?tid=1441850&extra=&page=1

关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。