shell中的文本处理与正则表达式

本文详细介绍了正则表达式的基础知识,并讲解了grep, awk, sed这三个强大的文本处理工具。通过实例演示了如何使用grep进行文本过滤,包括字符匹配次数设定;接着详细阐述了sed的行编辑功能,如p模式、d模式、a模式、i模式、c模式和w模式。最后,概述了awk在生成报告方面的强大能力。" 6859778,1181448,Hadoop Map-Reduce运行机制深度解析,"['Hadoop', 'Map-Reduce', '大数据开发']
摘要由CSDN通过智能技术生成

######################1.正则表达式概述#############################

正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。 

许多程序设计语言都支持利用正则表达式进行字符串操作。例如,在Perl中就内建了一个功能强大的正则表达式引擎。正则表达式这个概念最初是由Unix中的工具软件(例如sed和grep)普及开的。

#######################2.文本处理工具##########################################

#############(1) grep(文本过滤命令)

简介:

       grep 命令是一种强大的文本搜索工具,根据用户指定的“模式”对目标文本进行匹配检查,打印匹配到的行,由正则表达式或者字符机基本文本字符所编写的过滤条件。

       

(1)grep匹配字符

                    -E ##扩展正则表达式

-i #不区分大小写

-v #反向过滤,输出不符合条件的,可以理解为屏蔽

grep root passwd ##模糊过滤root字符

grep -E "\<root" passwd ##模糊过滤以root开头的字符

grep -E "\<root\>" passwd ##精确过滤以root字符

grep -E -i "\<root\>" passwd ##忽略大小写过滤root字符

grep -E -i "^\<root\>" passwd ##忽略大小写过滤以root字符开头的行

grep -E -i "\<root\>$" passwd ##忽略大小写过滤以root字符结尾的行

grep -E "root|ROOT" passwd ##模糊过滤root和ROOT字符

                    grep -E =egrep -E=\(转译字符)加-E后可以不使用

如何过滤root在行中间的行?

grep -v -i -E "^root|root$" passwd | grep -i root

(2)grep中字符匹配次数的设定

grep 'r..t' test 中间有几个字符就有几个点

grep -E 'r?t' test 字符出现0-1

grep -E 'r*t' test 字符出现0-任意次

grep -E

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值