python中re模块的使用以及一些正则表达式的总结-CSDN博客

一、re模块的使用-常用方法

match(pattern, string, flags = 0)　从string的第一个字符来匹配。如果匹配成功，返回匹配对象，否则返回None，匹配结果可以用group方法获取

import re 
c = re.match('[0-9]+[a-z]+', 'a99aaa')
print(c.group(0))

结果：

---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)
<ipython-input-5-3b2f2f09c3e5> in <module>()
1 import re
2 c = re.match('[0-9]+[a-z]+', 'a99aaa')
----> 3 print(c.group(0))

　　AttributeError: 'NoneType' object has no attribute 'group'

import re 
c = re.match('[0-9]+[a-z]+', '99aaa')
print(c.group(0))

结果：
99aaa

search(pattern, string ,flags = 0) 　　　匹配字符串中第一次出现的符合正则的子串，没有从第一个字符匹配的限制。如果匹配成功，则返回匹配对象，否则返回None

import re 
c = re.search('[0-9]+[a-z]+', 'aa99aaa')
print(c.group(0))
结果：
99aaa

findall(pattern, string[,flags] ) 　　　　查找字符串中所有(非重复)出现的正则表达式模式，并返回一个匹配列表

import re 
c = re.findall('[0-9]+[a-z]+', 'aa99aaa88bb77cc')
print(c)
结果：
['99aaa', '88bb', '77cc']

finditer(pattern, string[,flags] ) 　　　　与findall()相同，但返回的是一个迭代器。对于每一次成功匹配，迭代器都会返回一个匹配对象

import re 
c = re.finditer('[0-9]+[a-z]+', 'aa99aaa88bb77cc')
for i in c:
    print(i.group(0))
结果：
99aaa
88bb
77cc

split(pattern, string, max = 0) 　　　　根据正则表达式的模式分隔符，split函数将字符串分割为列表，返回匹配列表，分割最多操作max次

import re 
c = re.split('[0-9]+', 'aa99aaa88bb77cc', 2)
print(c)
结果：
['aa', 'aaa', 'bb77cc']

compile(pattern) 　　　　　　生成一个规则模式，返回一个正则表达式对象

import re 
c = re.compile('[0-9]+[a-z]+')
r = re.findall(c, 'aa99aaa88bb')
print(r)
结果：
['99aaa', '88bb']

以上方法中的flags参数为匹配模式，如下：

1).re.I(re.IGNORECASE): 忽略大小写
2).re.M(MULTILINE): 多行模式，改变’^’和’$’的行为
3).re.S(DOTALL): 点任意匹配模式，改变’.’的行为，使其可以匹配'\n'
4).re.L(LOCALE): 使预定字符类 \w \W \b \B \s \S 取决于当前区域设定
5).re.U(UNICODE): 使预定字符类 \w \W \b \B \s \S \d \D 取决于unicode定义的字符属性
6).re.X(VERBOSE): 详细模式。这个模式下正则表达式可以是多行，忽略空白字符，并可以加入注释

二、常用正则