Python实用技法第27篇:编写多行模式的正则表达式

1、需求?

我们打算用正则表达式对一段文本块做匹配,但是希望在进行匹配时能够跨越多行。

2、解决方案?

这个问题一般出现在希望使用句点(.)来匹配任意字符,但是忘记了句点并不能匹配换行符。

实例:假设向匹配C语言风格的注释:

import re

str_pat=re.compile(r'/\*(.*?)\*/')
text1="/* mark */"
text2='''/* mark 
            2018    */'''
print(str_pat.findall(text1))
print(str_pat.findall(text2))
Python资源分享qun 784758214 ,内有安装包,PDF,学习视频,这里是Python学习者的聚集地,零基础,进阶,都欢迎

结果:

[' mark ']
[]

要解决这个问题,可以添加对换行符的支持。

实例:

import re

#将.换成(?:.|\n)
str_pat=re.compile(r'/\*((?:.|\n)*?)\*/')
text1="/* mark */"
text2='''/* mark 
            2018    */'''
print(str_pat.findall(text1))
print(str_pat.findall(text2))

结果:

[' mark ']
[' mark \n 2018 ']

(?:.|n)指定了一个非捕获组(即,这个组只做匹配但不捕获结果,也不会分配组号)。

3、分析?

re.compile()函数可接受一个有用的标记:re.DOTALL,这使得表达式中的句点【.】可以匹配所有的字符,也包括换行符。

实例:

import re

str_pat=re.compile(r'/\*(.*?)\*/',re.DOTALL)
text1="/* mark */"
text2='''/* mark 
            2018    */'''
print(str_pat.findall(text1))
print(str_pat.findall(text2))

结果:

[' mark ']
[' mark \n 2018 ']
Python资源分享qun 784758214 ,内有安装包,PDF,学习视频,这里是Python学习者的聚集地,零基础,进阶,都欢迎

对于简单的情况,使用re.DOTALL标记就可以很好的完成工作。但是如果要处理及其复杂的模式,可以选择利用非捕获组定义在自己的表达式中,这样无需额外的标记也能正常工作。

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值