1.re.match函数
re.match尝试从字符的起始位置匹配一个模式
,如果不是起始位置匹配成功的话,match()就返回none
re.match(pattern, string, flags=0)
pattern 匹配的正则表达式
string 要匹配的字符串
flags 标志位
使用group(num)或groups()匹配对象函数来获取匹配表达式
#!/usr/bin/python
import re
line = "Cats are smarter than dogs"
matchObj = re.match( r'(.*) are (.*?) .*', line, re.M|re.I)
if matchObj:
print "matchObj.group() : ", matchObj.group()
print "matchObj.group(1) : ", matchObj.group(1)
print "matchObj.group(2) : ", matchObj.group(2)
else:
print "No match!!"
# r表示字符串为非转义的原始字符,让编译器忽略反斜杠
# (.*) 第一个匹配组, .*匹配除换行符之外所有字符
# (.*?)第二个匹配组,代表非贪婪模式,也就是说只匹配符合条件的最少字符
# .* 不是匹配组,效果一样,但不计入匹配结果中
输出:
2.re.search函数
re.search扫描整个字符串并返回第一个成功的匹配
re.search(pattern, string, flags=0)
print(re.search('www', 'www.runoob.com').span())
re.match与re.search的区别:
re.match只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回None;
而re.search匹配整个字符串,直到找到一个匹配