正则表达式 - re模块
1. findall函数
>>> import re
>>> s='123abc456eabc789'
>>> re.findall(r’abc’,s)
结果:['abc', 'abc']
返回结果是一个列表,中间存放的是符合规则的字符串,如果没有符合规则的字符串被找到,就返回一个空列表。
2. compile函数
>>> s='111,222,aaa,bbb,ccc333,444ddd123abc456eabc789'
>>> rule=r’\b\d+\b’
>>> compiled_rule=re.compile(rule)
>>> compiled_rule.findall(s)
结果:['111', '222']
直接使用findall ( rule , target )的方式来匹配字符串,一次两次没什么,如果是多次使用的话,由于正则引擎每次都要把规则解释一遍,而规则的解释又是相当费时间的,所以这样的效率就很低了。如果要多次使用同一规则来进行匹配的话,可以使用re.compile函数来将规则预编译,使用编译过返回的Regular
Expression Object或叫做Pattern对象来进行查找。
compile函数还可以指定一些规则标志,来指定一些特殊选项,多个选项之间用 ’|’(位或)连接起来。
I IGNORECASE 忽略大小写区别
M MULTILINE 多行匹配。在这个模式下’^’(代表字符串