一、概念
正则表达式:
是对字符串操作的一种逻辑公式,就是用事先定义好的一些特殊字符、及这些特定字符的组合,组成一个“规则字符串”。这个“规则字符串”用来表达对字符串的一种过滤逻辑
二、单个字符匹配
"""
. 匹配单个任意字符
[ ] 匹配[ ]内按序任意单个字符
\d 匹配单个数字
\w 匹配0-9,a-z,A-Z以及_
\s 匹配空白字符 空格 tab键
"""
import re
a=re.findall(".ood","I say Good not food!")
b=re.findall("[Gf]ood","I say Good not food!")
c=re.findall("\d","I am 40")
d=re.findall("\d\d","I am 40")
e=re.findall("\w","I say Good not food!!!")
f=re.findall("\s","I say Good not food!!!")
print(a)
print(b)
print(c)
print(d)
print(e)
print(f)
三、匹配一组字符串
import re
a=re.findall("Good","I say Good not food!") #直接匹配
b=re.findall("Good | food","I say Good not food!") #分隔符 | 匹配两个不同的字符串
c=re.findall("go*gle","I like google not ggle goooogle and gogle") #分隔符 * 匹配左邻字符串出现0次或者多次
d=re.findall("go+gle","I like google not ggle goooogle and gogle") #分隔符 + 匹配左邻字符串出现1次或者多次
e=re.findall("go?gle","I like google not ggle goooogle and gogle") #分隔符 ? 匹配左邻字符串出现0次或者1次
f=re.findall("go{2,10}gle","I like google not ggle goooogle and gogle") #分隔符 {2,10} 匹配左邻字符串最少2次或者最多10次
g=re.findall("^I like","I like google not ggle goooogle and gogle") #分隔符 ^ 表示以右侧内容开头
h=re.findall("gogle$","I like google not ggle goooogle and gogle") #分隔符 $ 表示以左侧内容结尾
i1=re.search("(tom)\\1","I like tomtomtomtomtomtomtomt") #分隔符 ( ) 表示分组保存()\\分组数
i2=i1.group()
print(a)
print(b)
print(c)
print(d)
print(e)
print(f)
print(g)
print(h)
print(i1)
print(i2)