常用函数
match() 决定 RE 是否在字符串刚开始的位置匹配
search() 扫描字符串,找到这个 RE 匹配的位置
findall() 找到 RE 匹配的所有子串,并把它们作为一个列表返回
finditer() 找到 RE 匹配的所有子串,并把它们作为一个迭代器返回
修饰符:上面函数第三个参数
DOTALL, S 使 . 匹配包括换行在内的所有字符
IGNORECASE, I 使匹配对大小写不敏感
LOCALE, L 做本地化识别(locale-aware)匹配
MULTILINE, M 多行匹配,影响 ^ 和 $
VERBOSE, X 能够使用 REs 的 verbose 状态,使之被组织得更清晰易懂
(?P<name>...) 匹配的命名组,让匹配的东西能以键 name 的方式取得
(?P=name) 引用已匹配的命名组
(?=...) 正向匹配,例如 window (?=2000|xp|vista)
(?<=...) 返向匹配,例如 (?=2000|xp|vista) window, 与 (?=...) 刚好相反
(?!...) 正向不匹配
(?<!...) 返回不匹配
\number 引用已匹配 \1 \2 表示第一个、第二个匹配
例子1:(?P<name>...)
例子2:(?=...) 与 (?<=...)
match() 决定 RE 是否在字符串刚开始的位置匹配
search() 扫描字符串,找到这个 RE 匹配的位置
findall() 找到 RE 匹配的所有子串,并把它们作为一个列表返回
finditer() 找到 RE 匹配的所有子串,并把它们作为一个迭代器返回
修饰符:上面函数第三个参数
DOTALL, S 使 . 匹配包括换行在内的所有字符
IGNORECASE, I 使匹配对大小写不敏感
LOCALE, L 做本地化识别(locale-aware)匹配
MULTILINE, M 多行匹配,影响 ^ 和 $
VERBOSE, X 能够使用 REs 的 verbose 状态,使之被组织得更清晰易懂
(?P<name>...) 匹配的命名组,让匹配的东西能以键 name 的方式取得
(?P=name) 引用已匹配的命名组
(?=...) 正向匹配,例如 window (?=2000|xp|vista)
(?<=...) 返向匹配,例如 (?=2000|xp|vista) window, 与 (?=...) 刚好相反
(?!...) 正向不匹配
(?<!...) 返回不匹配
\number 引用已匹配 \1 \2 表示第一个、第二个匹配
例子1:(?P<name>...)
import re
m = re.search('(?P<word>[a-z]+)(?P<num>\d+)', 'ab12')
print repr(m.group())
print repr(m.group('word')), ',', repr(m.group(1))
print repr(m.group('num')), ',', repr(m.group(2))
输出结果
'ab12'
'ab' , 'ab'
'12' , '12'
例子2:(?=...) 与 (?<=...)
import re
m = re.findall('(?<=1)(a|b|c)', 'a1b2c3')
print repr(m)
m = re.findall('(a|b|c)(?=1)', 'a1b2c3')
print repr(m)
输出结果:
['b']
['a']
例子3:(?!...) 与 (?<!...)
import re
m = re.findall('(?<!1)(a|b|c)', 'a1b2c3')
print repr(m)
m = re.findall('(a|b|c)(?!1)', 'a1b2c3')
print repr(m)
输出结果:
['a', 'c']
['b', 'c']
例子(组合):
import re
m = re.search('(?<=abc)END(?P<word>[a-z]+)(?P<num>\d+)START(?=hello)', 'abcENDde12STARThello')
print repr(m.group())
print repr(m.group('word')), ',', repr(m.group(1))
print repr(m.group('num')), ',', repr(m.group(2))
输出结果:
'ENDde12START'
'de' , 'de'
'12' , '12'