老男孩带你了解perl正则表达式中的零宽断言

老男孩IT教育老男孩老师为大家整理了perl正则表达式中的零宽断言的方法,希望能帮到大家

1.1前言

本文只介绍perl语言正则表达式的零宽断言功能。
零宽断言实质:匹配文本里面的位置。
零宽断言叫zero-length assertions,也叫lookaround(这个更容易理解)。
包括:lookahead(向前看,零宽度正预测先行断言),lookbehind(向后看,零宽度正回顾后发断言)。
从左到右对文本进行匹配,判断是否符合exp表达式。

名字表达式如果子表达式成功则…
positive lookahead
(零宽度正预测先行断言)
(?=subexp)如果匹配到右边则成功
negative lookahead
(零宽度负预测先行断言)
(?!subexp)如果没有匹配到右边则成功
注:成功就是找到对应的位置

1.2 lookahead 向前看-找到匹配内容前面的位置

 
  如图所示:首先这个是lookahead(向前看)他匹配exp这个词(oldboy)之前的一个位置,同时是 positive lookahead是表示匹配到exp就成功的意思。
  注:先理解lookahead的含义。然后对比理解positive lookahead和negative lookahead的区别。
 

1.3 lookbehind 向后看,找到匹配内容的后面的位置

lookbehind(向后看),从右向左匹配,判断是否符合exp表达式。
名字表达式如果子表达式成功则…
positive lookbehind
(零宽度正回顾后发断言)
(?<=subexp)如果匹配到左边则成功
negative lookbehind
(零宽度负回顾后发断言)
(?<!subexp)如果没有匹配到左边则成功
#注:成功就是找到对应的位置
 
 

1.4 lookahead 与lookbehind区别

 
如图所示lookahead匹配的位置是在subexp之前,lookbehind匹配的位置是在subexp之后。

1.5 perl常用的转义字符

转义字符含义
\b单词的边界。
\w表示[a-zA-Z0-9_]中任意一个字符
\W与\w相反表示不在[a-zA-Z0-9_]中的任意字符
\d[0-9]中的一个数字
\D不在[0-9]中的任意字符
 
 

1.6 案例1:实战演示:取IP地址

基本格式,红色就是我们的目标。
[root@node1 oldboy]# ifconfig eth0
eth0      Link encap:Ethernet  HWaddr 00:0C:29:3A:C5:88  
          inet addr:192.168.85.50  Bcast:192.168.85.255  Mask:255.255.255.0
          inet6 addr: fe80::20c:29ff:fe3a:c588/64 Scope:Link
          UP BROADCAST RUNNING MULTICAST  MTU:1500  Metric:1
          RX packets:81923 errors:0 dropped:0 overruns:0 frame:0
          TX packets:26480 errors:0 dropped:0 overruns:0 carrier:0
          collisions:0 txqueuelen:1000
          RX bytes:96099065 (91.6 MiB)  TX bytes:3459424 (3.2 MiB)

方法一:使用positive lookahead(正常向前看,零宽度正预测先行断言)
[root@node1 oldboy]# ifconfig eth0 | grep -oP "[0-9.]+(?=  Bcast)"
192.168.85.50 
[root@node1 oldboy]# ifconfig eth0 | grep -oP "[\d.]+(?=  Bcast)"
192.168.85.50 
说明:
1.这里使用lookahead的时候要注意,Bcast前面有两个空格,匹配时要注意他们。
2.前面已经说过,\d çè[0-9]

方法二:使用positive lookbehind(正常向后看,零宽度正回顾后发断言)
[root@node1 oldboy]# ifconfig eth0 | grep -oP '(?<=\baddr:)[\d.]+'
192.168.85.50

方法三:使用零宽度负预测先行断言
[root@node1 oldboy]# ifconfig eth0|grep -oP 'addr:[\d\.]+(?![\d\.])'
addr:192.168.85.50
但是去掉"addr:"还是需要使用lookbehind(向后看,零宽度正回顾后发断言)
[root@node1 oldboy]# ifconfig eth0|grep -oP '(?<=addr:)[\d\.]+(?![\d\.])'
192.168.85.50

方法四:使用零宽度负向回顾后发断言
[root@node1 oldboy]# ifconfig eth0|grep -oP '(?<![\d\.])[\d\.]+(?)  Bca'
192.168.85.50  Bca
但是后面的去除需要使用使用零宽度正预测先行断言
[root@node1 oldboy]# ifconfig eth0|grep -oP '(?<![\d\.])[\d\.]+(?)(?=  Bca)'
192.168.85.50 


更多精彩请关注老男孩 linux培训
 
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值