Linux文本处理工具

最新推荐文章于 2022-10-25 11:25:45 发布

筑梦之人

最新推荐文章于 2022-10-25 11:25:45 发布

阅读量74

点赞数

分类专栏： Linux 文章标签： linux

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/co_zjw/article/details/111554727

版权

Linux 专栏收录该内容

17 篇文章 0 订阅

订阅专栏

文本处理三剑客

grep: 文本过滤工具
sed: stream editor，流编辑器，文本编辑器
awk: 文本报告生成器（格式化文本）

grep正则表达式

grep使用：

grep [options] PATTERN [FILE…]

grep [OPTIONS] [-e PATTERN] [-f FILE] [FILE…]

选项：
–color=auto：对匹配上的文本着色后高亮显示

-i: ignorecase, 忽略字符大小写

-o: 仅显示匹配的字符串本身

-v, --invert-match: 显示不能被模式匹配到的行

-E: 支持使用扩展的正则表达式元字符

-q, --quiet,–silent: 静默模式，不输出任何内容

-A number: after，显示匹配上的后number行

-B number: before，显示匹配上的前number行

-C number: context，显示匹配上的前后number行

基本正则表达式元字符：

1、字符匹配

.: 匹配任意单个字符

[]: 匹配指定范围内的任意单个字符

[^]: 匹配指定范围外的任意单个字符

特殊表达：[:digit:]、[:upper:]、[:lower:]、[:alpha:]、[:alnum:]、[:punct:]、[:space:]

2、匹配次数

*: 任意次，可以是0，1或者多次

\?: 匹配0或者1次

\+: 匹配1次或者多次

\{m\}: 精确匹配m次

\{m,n\}: 至少匹配m次，最多匹配n次

\{m,\}: 至少匹配m次

\{0,n\}: 最多匹配n次

3、位置锚定

^: 锚定行首

$: 锚定行末

\<或者\b: 锚定单词首

\>或者\b: 锚定单词末

4、分组及引用

(): 小括号中的多个字符被绑定在一起，作为整体被处理

\1或者\2或者\3: 模式从左侧起，第一（二、三）个括号以及与之匹配的右括号之间的模式所匹配的字符串

egrep扩展的正则表达式

grep -E等效于egrep，egrep的选项与grep的常用选项基本一直，支持-i -o -v -q -A -B -C，-G支持基本的正则表达式。

扩展的正则表达式元字符

1、字符匹配：

.: 匹配任意单个字符

[]: 匹配指定范围内的任意单个字符

[^]: 匹配指定范围外的任意单个字符

2、匹配次数

*: 任意次，可以是0，1或者多次

?: 匹配0或者1次

+: 匹配1次或者多次

{m}: 精确匹配m次

{m,n}: 至少匹配m次，最多匹配n次

{m,}: 至少匹配m次

{0,n}: 最多匹配n次

3、位置锚定

^: 锚定行首

$: 锚定行末

\<或者\b: 锚定单词首

\>或者\b: 锚定单词末

4、分组及引用

(): 小括号中的多个字符被绑定在一起，作为整体被处理

\1或者\2或者\3: 模式从左侧起，第一（二、三）个括号以及与之匹配的右括号之间的模式所匹配的字符串

5、或者关系

a|b:匹配a或者b，例如：C|cat匹配C或者cat，而(c|C)at匹配cat或者Cat

fgrep不支持正则表达式

当无需使用正则时使用fgrep效率更高

文本查看及处理工具

1、wc

-l 统计行数
-w 统计单词数
-c 统计字节数

2、cut

-d char: 以指定的字符为分隔符
-f FIELDS: 前行出字段
#: 指定单个字段
#-#: 连续的几个字段
#,#: 离散的多个字段

例如: cut -d: -f1,3-5,7 /etc/passwd表示查看按:分隔的第1个，3-5个和第7个字段内容。

3、sort

sort [OPTION]… [FILE]…

-t CHAR: 指定分隔符
-k #: 指定排序的字段
-n: 基于数字大小排序，默认为字符字典排序
-r: 逆序排序
-f: 不区分大小写
-u: 去重

例如：sort -t: -k4 -u -f -r -n /etc/passwd

4、uniq

-c: 显示美航的重复次数
-u: 仅显示未重复的行
-d: 仅显示重复的行

例如：cut -d: -f7 /etc/passwd | sort | uniq -c cut -d: -f7 /etc/passwd | sort | uniq -u cut -d: -f7 /etc/passwd | sort | uniq -d

5、diff

diff oldFile newFile

-u: 使用unfied机制，显示修改行的上下文，默认为上下3行，可以使用-u#指定行数

6、patch 向文件打补丁

patch [OPTIONS] -l patch_file oldfile

patch oldfile < patch_file

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Linux文本处理工具

文本处理三剑客grep: 文本过滤工具sed: stream editor，流编辑器，文本编辑器awk: 文本报告生成器（格式化文本）grep正则表达式grep使用：grep [options] PATTERN [FILE…]grep [OPTIONS] [-e PATTERN] [-f FILE] [FILE…]选项：–color=auto：对匹配上的文本着色后高亮显示-i: ignorecase, 忽略字符大小写-o: 仅显示匹配的字符串本身-v, --inve
复制链接

扫一扫

专栏目录

博客等级

码龄9年

119
原创

56
点赞

268
收藏

32
粉丝

关注

私信

热门文章

分类专栏

Linux 17篇
juc 2篇
Elasitcsearch 11篇
消息中间件MQ 15篇
ETL工具
消息中间件—RocketMQ 1篇
计算机基础 2篇
golang 2篇
Docker 3篇
ES 1篇
Nginx 1篇
存储 1篇
tomcat 1篇
java 8篇
大数据 6篇
HBase 5篇
Delta Lake 1篇
JVM 2篇
多线程与高并发 1篇
log4j2 2篇
logback 1篇
SpringBoot 3篇
翻译 2篇
构建工具 5篇
数据结构与算法 6篇
Netty 1篇
Zookeeper 1篇
Apollo 1篇

最新评论

MacOS下使用CLion编译调试MySQL8.x
LuckyFateZZL: Cannot find appropriate system libraries for WITH_SSL=system. Make sure you have specified a supported SSL version. Valid options are : system (use the OS openssl library), yes (synonym for system), </path/to/custom/openssl/installation> CMake Error at cmake/ssl.cmake:73 (MESSAGE): Please install the appropriate openssl developer package. make的时候找不到openssl，怎么解决呢？加-DWITH_SSL=system没有作用，终端是能打开openssl的
最全的CentOS7腾讯云yum源
住在深海大菠萝里的大蘑菇成精了: 阿里的不也挺快嘛
SpringCloud项目github地址汇总
年少有为2025: 优秀！到位，saas在国内现在是真的火，尤其是toB的saas系统，最近看的一个免费开源的saas电商系统，weiit-saas真心不错。gitee上就能搜到！
消息中间件之ActiveMQ — 02
Monster_起飞: 大佬的文章让我受益颇多期待回访互关！
ElasticSearch读写底层原理及性能调优
Qonent: 好文

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。