正则....._matches = pattern.findall(text)-CSDN博客

本文链接：https://blog.csdn.net/weixin_42345008/article/details/81070481
#re.compile(r"模式")编译
'''
.match函数：.match 尝试从字符串的起始位置匹配一个模式，如果不是起始位置匹配成功的话，match()就返回none。
.search方法:re.search 扫描整个字符串并返回(第一个) 成功的匹配。
.match只匹配字符串的开始，如果字符串开始不符合正则表达式，则匹配失败，函数返回None；而.search匹配整个字符串，直到找到一个匹配。但是他们都返回Matchobject
.findall()查找所有非重叠匹配项，返回list
.findaiter()查找所有匹配项，返回Matchobject元素的迭代器
'''
'''
.group()参数为0或无参时返回整个匹配，有参时返回特定分组匹配细节，参数可是分组名称
.groups()包含所有子分组的元组
.start()返回特定分组的起始索引
.end()返回特定分组的终止索引
.span()返回特定分组的起止索引
.groupdict()以字典形式返回分组名及结果
'''
'''
.split()分割字符串
.sub()替换字符串
.subn()替换字符串并返回替换数量
'''
'''
re.I忽略大小写
re.M匹配多行
re.S指定"."匹配所有字符，包括\n  (！！原本'.'匹配所有字符但不包括\n)
'''
'''
re.purge()清理正则缓存
re.escape()逃逸字符
'''
import re
text = ' Tom is 8 years old.\\*Lucy* is 23 years old.'
print('-------.findall()----------------------')
#编译
pattern = re.compile('\d+')
print(pattern.findall(text))
#不编译时：
print(re.findall('\d+',text))
print(re.findall('\d',text))
#--------
pattern2 = re.compile('[A-Z]\w+')
print(pattern2.findall(text))
#--------
pattern3 = re.compile(r'\\Lucy')#有点问题
print(pattern3.findall(text))
print('----------.finditer()--------------------')
it = pattern.finditer(text)
for i in it:
    print(i)
it2 = re.finditer('(\w+) (\w+)',text)
for m in it2:
    print(m.group())
print('----------.match()-----------------------')
pattern4 = re.compile('Tom')
print(pattern4.match(text))#结果为空，因为text的第一个字符是空格
print(pattern4.match(text,1))#有结果，因为指定了开始位置
print('----------.search()-----------------------')
print(pattern.search(text))
print('-----------.group()--.start()和.end()-----------')
pattern5 = re.compile('(?P<name>\d+).*?(\d+)')#给组命名
g1 = pattern5.search(text)
print(g1)
print(g1.group())#g1.group()等同于g1.group(0)
print(g1.group(1))
print(g1.group(2))
print(g1.group('name'))
print(g1.start(2))
print(g1.end(2))
print('----------.split()和re.escape()-------------------')
sp1 = re.split(re.escape('.'),text)
print(sp1)

print('------------zonghe-----------')
z1 = re.search('ab+c','abcababc')
z2 = re.search('(ab)+c','abcababc')
z3 = re.findall('(ab)+c','abcababc')#结果为什么不是[abc,ababc]?????
print(z1.group())
print(z2.group())
print(z3)
z11 = re.search(r'Centre|er','Centre')
print(z11)
z22 = re.search(r'Centre|er','Center')
print(z22)
z33 = re.search(r'Cent(re|er)','Center')
print(z33)
z4 = re.search(r'(\w+) \1','hello world')
z5 = re.search(r'(\w+) (\w+) \2','hello world world world')
print(z4)
print(z5)
z6 = re.search('(?P<name>\w+):(?P<score>\d+)','Tom:88')#给组命名
print(z6.group())
print(z6.group('name'))
print(z6.group(2))
print('----------re.I  re.M  re.S--------------')
m1 = re.findall('^T','\nT')
print(m1)
m2 = re.findall('^T','\nT',re.M)
print(m2)
i1 = re.findall('low','Low,LOW,low')
i2 = re.findall('low','low,LOW,Low',re.I)
print(i1)
print(i2)
s1 = re.findall('\d(.)','1\ne')
print(s1)
s2 = re.findall('\d(.)','1\ne',re.S)
print(s2)
s3 = re.findall('\d.','1\ne',re.S)#不懂？？？
print(s3)
print('------------.sub()和.subn()-------------------')
su1 = re.sub(r'\*(.*?)\*','<strong></strong>',text)
print(su1)
su2 = re.sub(r'\*(?P<name>.*?)\*','<strong>\g<1></strong>',text)#\g<1>或\g<name>
print(su2)
text2 = 'aaa001,bbb002,ccc003'
su3 = re.sub(r'([a-z]+)(\d+)','\g<2>-\g<1>',text2)
print(su3)
su4 = re.subn(r'([a-z]+)(\d+)','\g<2>-\g<1>',text2)
print(su4)