shell 编程之正则表达式

        REGEXP: Regular Expressions,由一类特殊字符及文本字符所编写的模式,其中有些字符(元字符)不表示字符字面意义,而表示控制或通配的功能,类似于增强版的通配符功能,但与通配符不同,通配符功能是用来处理文件名,而正则表达式是处理文本内容中字符。正则表达式被很多程序和开发语言所广泛支持:vim, less,grep,sed,awk, nginx,mysql 等。主要用来匹配字符串(命令结果,文本内容)。

可以使用

man 7 regex
可以使用 man手册帮助

基本正则表达式 

元字符

  • .   匹配任意单个字符,可以是一个汉字。  
  • []   匹配指定范围内的任意单个字符,如: [0-9]   []   [a-zA-Z]   [:alpha:]。
  • [^] 匹配指定范围外的任意单个字符,如:[^a.z] [a.z]。
  • [:alnum:] 字母和数字。
  • [:alpha:] 代表任何英文大小写字符,亦即 A-Z, a-z。
  • [:lower:] 小写字母,示例:[[:lower:]],相当于[a-z]。
  • [:upper:] 大写字母。
  • [:blank:] 空白字符(空格和制表符)。
  • [:space:] 包括空格、制表符(水平和垂直)、换行符、回车符等各种类型的空白,比[:blank:]包含的范围广。
  • [:cntrl:] 不可打印的控制字符(退格、删除、警铃...)。
  • [:digit:] 十进制数字。
  • [:xdigit:]十六进制数字。
  • [:graph:] 可打印的非空白字符。
  • [:print:] 可打印字符。
  • [:punct:] 标点符号。
  • \w #匹配单词构成部分,等价于[_[:alnum:]]。
  • \W #匹配非单词构成部分,等价于[^_[:alnum:]]。
  • \S     #匹配任何非空白字符。等价于 [^ \f\n\r\t\v]。
  • \s     #匹配任何空白字符,包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。注意:Unicode 正则表达式会匹配全角空格符。

表示次数

  • * #匹配前面的字符任意次,包括0次,贪婪模式:尽可能长的匹配。
  • .* #任意长度的任意字符,不包括0次。
  • \? #匹配其前面的字符出现0次或1次,即:可有可无。
  • \+ #匹配其前面的字符出现最少1次,即:肯定有且 >=1 次。
  • \{n\} #匹配前面的字符n次。
  • \{m,n\} #匹配前面的字符至少m次,至多n次。
  • \{,n\}  #匹配前面的字符至多n次,<=n。
  • \{n,\}  #匹配前面的字符至少n次。
  • ifconfig ens33|grep netmask|grep -o 。

提取IP地址

位置锚定

  • ^ #行首锚定, 用于模式的最左侧
  • $ #行尾锚定,用于模式的最右侧
  • ^PATTERN$ #用于模式匹配整行 (单独一行  只有root)
  • ^$ #空行
  • ^[[:space:]]*$ #  空白行
  • \< 或 \b        #词首锚定,用于单词模式的左侧(连续的数字,字母,下划线都算单词内部)
  • \> 或 \b        #词尾锚定,用于单词模式的右侧
  • \<PATTERN\>  或  \bPATTERN\b   #匹配整个单词

分组或其他

分组:( ) 将多个字符捆绑在一起,当作一个整体处理,如:(root)+

后向引用:分组括号中的模式匹配到的内容会被正则表达式引擎记录于内部的变量中,这些变量的命名方式为: \1, \2, \3, ...   其中,\1 表示从左侧起第一个左括号以及与之匹配右括号之间的模式所匹配到的字符。

或者:\ | 

扩展正则表达式

表示次数

*   匹配前面字符任意次
?  0或1次
+  1次或多次
{n}  匹配n次
{m,n} 至少m,至多n次
{,n}  #匹配前面的字符至多n次,<=n,n可以为0
{n,} #匹配前面的字符至少n次,<=n,n可以为0

表示分组

() 分组
分组:() 将多个字符捆绑在一起,当作一个整体处理,如:\(root\)+
后向引用:\1, \2, ...
| 或者  
a|b #a或b
C|cat #C或cat
(C|c)at #Cat或cat

grep

  • grep -E  用于基本正则表达式。
  • egrep  用于扩展正则表达式

格式:grep 【选项】...查找条件   目标文件

选项:
-color=auto   对匹配到的文本着色显示
-m  #   匹配#次后停止
grep -m 1 root /etc/passwd   #多个匹配只取第一个
-v  显示不被pattern匹配到的行,即取反
grep -Ev '^[[:space:]]*#|^$' /etc/fstab
-i 忽略字符大小写
-n 显示匹配的行号
-c 统计匹配的行数
grep -c root /etc/passwd    #统计匹配到的行数
-o 仅显示匹配到的字符串
-q 静默模式,不输出任何信息
-A # after, 后#行 
grep -A3 root /etc/passwd   #匹配到的行后3行业显示出来
-B # before, 前#行
-C # context, 前后各#行
-e 实现多个选项间的逻辑or关系,如:grep –e ‘cat ' -e ‘dog' file
grep -e root -e bash /etc/passwd #包含root或者包含bash 的行
grep -E root|bash  /etc/passwd
-w 匹配整个单词
grep -w root /etc/passwd
useradd rooter
-E 使用ERE,相当于egrep
-F 不支持正则表达式,相当于fgrep
-f   file 根据模式文件,处理两个文件相同内容 把第一个文件作为匹配条件
-r   递归目录,但不处理软链接
-R   递归目录,但处理软链接

练习

表示QQ号

表示邮箱

表示手机号

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值