正则表达式
就是用来找到符合模式的字符串,这些模式包括:是什么字符,重复多少次,在什么位置,有哪些额外的约束
找某个字符串
import re
text='身高:178 体重:168 学号:123456 密码:9527'
#在Python中,r前缀用于创建一个原始字符串(raw string)。
#原始字符串中的反斜杠字符将被视为普通字符而不是转义字符。这在处理正则表达式时很有用,因为正则表达式通常包含许多反斜杠。
print(re.findall(r'123456',text))#使用re的findall找到符合模式的字符串,这边还可以用in来判断
#结果为['123456'],因为只能找到一个
找某一类字符串
import re
text='身高:178 体重:168 学号:123456 密码:9527'
print(re.findall(r'\w',text))#d代表digital数字,w代表word字符
print(re.findall(r'[1-5]',text))#找到字符串中所有1-5的数字
重复的某一类字符串
import re
text='身高:178 体重:168 学号:123456 密码:9527'
print(re.findall(r'\d+',text))#d代表digital数字,w代表word字符
#d+表示可以是多个数字
#['178', '168', '123456', '9527']
print(re.findall(r'\d',text))#['1', '7', '8', '1', '6', '8', '1', '2', '3', '4', '5', '6', '9', '5', '2', '7']
print(re.findall(r'\d?',text))#?表示0个或一个数字
print(re.findall(r'\d*',text))#*表示零个或多个数字
print(re.findall(r'\d{3}',text))#*要求出现三个数字['178', '168', '123', '456', '952']
print(re.findall(r'\d{1,}',text))#表示大于等于1位的数字,‘,’右边若有数字表示小于等于多少
+?之类的统称为量词
多个条件
import re
#找到一个座机号码
text='电话是188123456789,他还有一个电话号码是18887654321.他的座机号码是0574-52112345'
#d代表digital数字,w代表word字符
print(re.findall(r'\d{3,4}-\d{7,8}',text))#找前面三到四位-后面七到八位数字,这是两个子模式的结合
print(re.findall(r'\d{3,4}-\d{7,8}|1\d{10}',text))#两种条件中间加或(|)就可以了
两种模式之间加或(|)
指定位置匹配
import re
#找到一个指定位置的座机号码
text='188987654321 电话是188123456789,他还有一个电话号码是18887654321.他的座机号码是0574-52112345'
#d代表digital数字,w代表word字符
print(re.findall(r'^1\d{10}|\d{4}-\d{8}$',text))#^表示匹配开头的字符串,结尾的$表示匹配结尾
写正则表达式的步骤
1.确认模式包含几个子模式
2.各个部分的字符分类分别是什么
3.各个部分如何重复
4.是否有外部位置限制
5.是否有内部限制