正则表达式

最新推荐文章于 2024-10-01 22:54:40 发布

又双叒叕报错啦

最新推荐文章于 2024-10-01 22:54:40 发布

阅读量276

点赞数

文章标签： linux 笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_73792056/article/details/134153536

版权

本文介绍了Linux中常用的文本处理工具grep（搜索）、sed（编辑）、awk（提取）、sort（排序）、uniq（去重）、tr（字符转换）、cut（切割）、split（拆分）和paste（合并），以及正则表达式的使用。还讨论了如何优化大文件处理和网络连接状态统计。

摘要由CSDN通过智能技术生成

grep命令:过滤查找文本内容。

-m:匹配几次之后停止。按行匹配。不是字符个数。

-v:取反。

-n显示匹配的行号

-c 仅显示匹配的行数，不显示匹配的内容

-o 仅显示匹配的内容

-q 静默模式

-A 数字：after后几行

-B ：匹配到的行，以及前几行

-C ：前后各几行

-e ：实现多个过滤条件之间的逻辑或关系

-w ：匹配整个单词

-E ：使用扩展正则表达式

-f ：根据模式文件进行匹配，匹配两个文件相同的内容。

文本三剑客：grep主要就是查

sed增和改

awk按行取列

都是针对文本的内容。

-r ：递归目录，但是不处理软链接，匹配目录中的文本的内容。

-R ：处理软链接

-E ：扩展正则

sort ：按照行对文件内容进行排序，也可以根据不同的数据类型进行排序

sort 选项参数

cat 文件 | sort 选项

-f ：忽略大小写，默认会把大写字母排在前面

-b ：忽略每行前面的空格

-n ：按照数字进行排序

-r ：反向排序

-u ：相同的数据只显示一行

-o ：将排序后文件内容转存到指定文件

uniq

按行来进行处理，去重复行（连续出现）。

uniq 选项参数

-c ：统计连续重复出现的行的次数，并且合并重复的行，并展示。

-u ：显示仅出现一次的行

-d ：显示仅重复出现的行

tr ：字符替换压缩删除

tr 选项参数

cat 文件 | tr 选项

-c ：保留字符集1的字符，其他字符用字符集2进行替换

-d ：删除字符集

-s ：重复出现的字符串压缩为一个字符串

-t ：默认可以不加

cut快速裁剪：

对字段进行截取和裁剪

cut 选项参数

cat 文件 | cut 选项

-d ：指定裁剪的分隔符（默认的分隔符的是tab的空格）

-f ：按行取列，根据第几个字段进行截取

-b ：以字节为单位进行截取

-c ：以字符为单位进行截取

-complement ：排除所指定的字段

-output-delimiter ：更改输出结果的分隔符

如何对文件进行拆分：

现在有一个日志文件，5G，直接打开速度很慢，有什么办法进行优化呢？

文件进行拆分

split 可以把大文件拆分成若干小文件。

-l 指定行数进行拆分

-b 指定大小进行拆分

paste合并文件：

cat合并文件和paste有什么区别

cat是上下合并

paste是左右合并

统计当前主机的连接状态

ss -nta | grep -v 'State' | cut -d " " -f 1 | sort | uniq -c

统计当前主机的连接数

ss -nt | tr -s " " | cut -d " " -f 4 | uniq -c

都是针对文件的内容进行操作

正则表达式：由一类特殊字符以及文件字符所编写的模式

其中有些字符不表示字符字面的含义，而表示控制或者通配的功能，用来处理文本当中的字符。

由一些特殊字符组成的特定格式的内容，用来匹配文件当中的内容。

linux当中的通配符:通配符用来匹配文件名或者目录名。

*：任意一个或多个字符。

？：匹配任意一个字符

[]:范围匹配

正则表达式：

元字符：

.匹配任意单个字符，也可以是一个汉字。

\转义符。

()分组\ ( \)

[]匹配范围内的单个字符

[[:blank:]]匹配空格和制表符

[^a]表示除了以外，取反

表示次数：

*：表示匹配前面的字符任意次，包括0次，尽可能长的匹配

.*：匹配前面的任意字符任意次，但是不包括0次

\？：匹配前面的字符0次或者1次，可有可无。

\ +：匹配前面出现的字符最少1次，最多无限. >=1

\ {n}\：表示前面的字符只能出现=n次

\ {n,m\ }：表示前面的字符最少n次，最多m次

\ {，n\ }：表示前面的字符最多出现n次。0次也算

\ {n,\ }:表示前面的字符，最少N次。

又双叒叕报错啦

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

又双叒叕报错啦 CSDN认证博客专家 CSDN认证企业博客

码龄2年

78: 原创

113万+: 周排名

15万+: 总排名

2万+: 访问

: 等级

1081: 积分

223: 粉丝

301: 获赞

13: 评论

313: 收藏

私信

关注

热门文章

最新评论

k8s集群调度
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/618123360。
正课笔记6
CSDN-Ada助手: 恭喜你写完了第15篇博客！标题里的“正课笔记6”让我感到很兴奋，因为这意味着你已经坚持创作了一段时间了。你的努力和毅力令人钦佩。在下一步的创作中，我想建议你探索更多不同的主题和观点。或许你可以尝试写一些与你当前博客系列有关的深入研究，或者挑战自己写一些关于其他领域的文章，这样可以为你的读者提供更多有趣和多元化的内容。当然，这只是我的一些建议，你可以根据自己的兴趣和创作方向来决定下一步的主题。期待看到你未来更多的作品！再次恭喜你，继续加油！
正课笔记7
CSDN-Ada助手: 恭喜您撰写了第16篇博客，标题为“正课笔记7”！持续创作是一项了不起的成就，您的努力和坚持值得赞赏。在这篇博客中，您似乎分享了关于正课的重要笔记，这对于许多读者来说无疑是非常有帮助的。接下来，我想给您一个谦虚的建议。既然您已经撰写了一系列关于正课的笔记，为什么不考虑进一步拓展您的创作领域呢？您可以尝试探索其他与学习相关的主题，或者分享一些实用的学习技巧和策略。这样做不仅可以吸引更广泛的读者群体，还能让您的读者从不同的角度来思考学习问题。再次恭喜您，期待您未来更多的创作！加油！
正课笔记4
CSDN-Ada助手: 恭喜你写了第13篇博客！持续创作是一个不断成长的过程，你已经取得了很大的进步。关于“正课笔记4”，你的标题很简洁明了，让读者一目了然。我很期待能够阅读你的博客内容，并从中获得新的知识和启发。在下一步的创作中，或许可以考虑加入一些个人的观点和思考，以丰富文章的深度和独特性。继续努力，我相信你会有更多精彩的作品呈现给我们！
正课笔记5
CSDN-Ada助手: 恭喜你写完了第14篇博客！看到你的标题是“正课笔记5”，我想你一定在坚持学习并将所学知识分享给大家。你的持续创作让人敬佩，也让读者们从中受益匪浅。接下来，我想给你一些建议。首先，你可以考虑在博客中更多地加入自己的观点和思考，这样读者能更好地了解你的见解。其次，尝试与读者互动，可以通过评论区或者社交媒体与他们交流，听取他们的反馈和建议。最后，你可以尝试写一些与学习相关的实践经验，这样不仅能够让读者更好地理解你所学的内容，还能帮助他们更好地应用到实际生活中。希望我的建议对你有所帮助。继续保持努力，期待看到你未来更多精彩的创作！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。