正则表达式‘?’用法

参考网址:http://www.cnblogs.com/xiashengwang/p/3988573.html
https://www.cnblogs.com/whaozl/p/5462865.html
——————————————————————————————————————————

1.非贪心匹配(紧随限定符’*’, ‘+’, ‘?’, ‘{n}’, ,’{n,}’, ‘{n,m}’之后)

2.子模式后面加上问号表示可选。

r'(http://)?(www\.)?python\.org'
可以匹配:'http://www.python.org' 
'www.python.org'  
'http://python.org'
和'python.org'

3.(?=…)和(?<=…)

前者用于正则表达式之后,表示如果=后的内容在字符串中出现则匹配,但不返回=之后的内容。后者用于正则表达式之前。简而言之就是匹配,捕获(储存),但不输出

正则表达式:(?<=(href=”)).{1,200}(?=(“>))
解释:(?<=(href=”)) 表示 匹配以(href=”)开头的字符串,并且捕获(存储)到分组中
(?=(“>)) 表示 匹配以(“>)结尾的字符串,并且捕获(存储)到分组中
但输出的仅是中间的部分

这里写图片描述

3.(?!…)的含义可以类比。

5.(?:…)

匹配但不捕获也不输出

正则表达式:(?<=(?:href=”)).{1,200}(?=(?:”>))
解释:(?<=(?:href=”)) 表示 匹配以(href=”)开头的字符串,并且不捕获(不存储)到分组中
(?=(?:”>)) 表示 匹配以(“>)结尾的字符串,并且不捕获(不存储)到分组中

这里写图片描述

(?:pattern)非获取匹配,匹配pattern但不获取匹配结果,不进行存储供以后使用。这在使用或字符“(|)”来组合一个模式的各个部分是很有用。例如“industr(?:y|ies)”就是一个比“industry|industries”更简略的表达式。
(?=pattern)非获取匹配,正向肯定预查,在任何匹配pattern的字符串开始处匹配查找字符串,该匹配不需要获取供以后使用。例如,“Windows(?=95|98|NT|2000)”能匹配“Windows2000”中的“Windows”,但不能匹配“Windows3.1”中的“Windows”。预查不消耗字符,也就是说,在一个匹配发生后,在最后一次匹配之后立即开始下一次匹配的搜索,而不是从包含预查的字符之后开始。
(?<=pattern)非获取匹配,反向肯定预查,与正向肯定预查类似,只是方向相反。例如,“(?<=95|98|NT|2000)Windows”能匹配“2000Windows”中的“Windows”,但不能匹配“3.1Windows”中的“Windows”。
(?<!pattern)非获取匹配,反向否定预查,与正向否定预查类似,只是方向相反。例如“(?<!95|98|NT|2000)Windows”能匹配“3.1Windows”中的“Windows”,但不能匹配“2000Windows”中的“Windows”。这个地方不正确,有问题
(?!pattern)非获取匹配,正向否定预查,在任何不匹配pattern的字符串开始处匹配查找字符串,该匹配不需要获取供以后使用。例如“Windows(?!95|98|NT|2000)”能匹配“Windows3.1”中的“Windows”,但不能匹配“Windows2000”中的“Windows”。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值