什么是正则表达式
- 定义:一套规则,可以在字符串文本中进行搜查替换等
- 使用步骤:
- 1.使用
compile()
函数将正则表达式的字符串编译成一个 pattern
对象
- 2.通过
pattern
对象的一些方法对文本进行匹配,匹配结果是一个 match
对象
- 3.用
match
对象的方法,对结果进行操作
- 常用方法:
- match:从开始位置开始查找,一次匹配,即1次匹配成功则退出
一般使用形式:
match(string[,pos[,endpos]])
- search:从任何位置开始查找,一次匹配
search[string[, pos[, endpos]]]
例子:
>>>import re
>>>pattern = re.compile(r'\d+')
>>>m = pattern.match('one12twothree34four')
>>>print(m)
>>>m = pattern.match('one12twothree34four', 2, 10)
>>>print(m)
>>>m = pattern.match('one12twothree34four', 3, 10)
>>>print(m)
<_sre.SRE_Match object at 0x10a42aac0>
>>>m.group(0)
'12'
>>>m.start(0)
3
>>>m.end(0)
5
>>>m.span(0)
(3, 5)
>>>m = pattern.search('one12twothree34four')
>>>m
<_sre.SRE_Match