Python 正则高级运用

常用函数
match()       决定 RE 是否在字符串刚开始的位置匹配
search()       扫描字符串,找到这个 RE 匹配的位置
findall()       找到 RE 匹配的所有子串,并把它们作为一个列表返回
finditer()   找到 RE 匹配的所有子串,并把它们作为一个迭代器返回

修饰符:上面函数第三个参数
DOTALL, S     使 . 匹配包括换行在内的所有字符
IGNORECASE, I     使匹配对大小写不敏感
LOCALE, L     做本地化识别(locale-aware)匹配
MULTILINE, M     多行匹配,影响 ^ 和 $
VERBOSE, X     能够使用 REs 的 verbose 状态,使之被组织得更清晰易懂  

(?P<name>...)   匹配的命名组,让匹配的东西能以键 name 的方式取得
(?P=name)        引用已匹配的命名组
(?=...)    正向匹配,例如 window (?=2000|xp|vista)
(?<=...)  返向匹配,例如 (?=2000|xp|vista) window, 与 (?=...) 刚好相反
(?!...)     正向不匹配
(?<!...)   返回不匹配
\number  引用已匹配 \1 \2 表示第一个、第二个匹配

例子1:(?P<name>...)
import re
m = re.search('(?P<word>[a-z]+)(?P<num>\d+)', 'ab12')
print repr(m.group())
print repr(m.group('word')), ',', repr(m.group(1))
print repr(m.group('num')), ',', repr(m.group(2))
输出结果
'ab12'
'ab' , 'ab'
'12' , '12'

例子2:(?=...)  与 (?<=...)
import re
m = re.findall('(?<=1)(a|b|c)', 'a1b2c3')
print repr(m)
m = re.findall('(a|b|c)(?=1)', 'a1b2c3')
print repr(m)

输出结果:

['b']
['a']

例子3:(?!...)  与 (?<!...)
import re
m = re.findall('(?<!1)(a|b|c)', 'a1b2c3')
print repr(m)
m = re.findall('(a|b|c)(?!1)', 'a1b2c3')
print repr(m)

输出结果:

['a', 'c']
['b', 'c']

例子(组合):
import re
m = re.search('(?<=abc)END(?P<word>[a-z]+)(?P<num>\d+)START(?=hello)', 'abcENDde12STARThello')
print repr(m.group())
print repr(m.group('word')), ',', repr(m.group(1))
print repr(m.group('num')), ',', repr(m.group(2))

输出结果:

'ENDde12START'
'de' , 'de'
'12' , '12'


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值