一 re模块下的一些常见方法
match,findeall,search,sub,split
二re.match方法
re.match 尝试从字符串的开始匹配一个模式。语法是re.match(pattern,string,flag)
>>> res = re.match('\d\w','1A',re.I)
>>> res.group(0)
'1A'
>>>
当我们把
字符串开头该为非整数时,会发现返回none,说明没有匹配到。这就是match的特点。
>>> res = re.match('\d\w','b1A',re.I)
>>> print res
None
>>>
三:re.search方法 语法 re . search ( pattern , string , flags = 0 )
re.search 会在字符串内查找模式匹配,直到找到第一个匹配。
>>> res = re.search('\d\w','1A',re.I)
>>> res.group(0)
'1A'
>>>
当修改字符串开头后,会发现还能匹配到。这就是search和match的区别、
>>> res = re.search('\d\w','b1A',re.I)
>>> res.group(0)
'1A'
>>>
四 : re.findall方法 语法 re.findall ( pattern , string , flags = 0 )
re.findall是在字符串查找匹配模式的所有字符串,返回的结果是list(列表),这是和match,search的区别之一
>>> res = re.findall('\d\w','1A',re.I)
>>> res
['1A']
>>> type(res)
<type 'list'>
>>>
findall返回的结果是所有能匹配的字符集。也就是
多个字符集。而match,search返回的是第一个匹配到的字符集对象。只有
一个。(前提是没有在匹配时进行分组)
>>> res = re.findall('\d\w','1A1A1A1A',re.I)
>>> res
['1A', '1A', '1A', '1A']
>>> res = re.match('\d\w','1A1A1A1A',re.I)
>>> res.group()
'1A'
>>> res = re.search('\d\w','1A1A1A1A',re.I)
>>> res.group()
'1A'
>>>
五 re.sub
语法re.sub(pattern, repl, string, max=0)用于替换字符串中的匹配项。
>>> res = re.sub('\d\w','BB','1A1A1A1A')
>>> print res
BBBBBBBB
匹配和替换的是多个字符集。返回的结果是一个字符串。
至于一些匹配模式,还有特殊字符等,建议查看w3c的文档教程。