re模块:匹配开头/结尾(^/$) https://blog.csdn.net/chenmozhe22/article/details/80602000
re模块的基础用法 https://blog.csdn.net/chenmozhe22/article/details/80601971
1、需求:匹配163.com的邮箱地址
email_list = ["xiaoWang@163.com", "xiaoWang@163.comheihei", ".com.xiaowang@qq.com"]
for email in email_list:
ret = re.match("[\w]{4,20}@163\.com$", email) \.代表只是一个点 $代表以xxx结尾的字符串
if ret:
print("%s ---是符合规定的邮件地址” % email)
else:
print("%s ---不符合要求" % email)
结果
xiaoWang@163.com # ---是符合规定的邮件地址
xiaoWang@163.comheihei # ---不符合要求 # 如果没有$,这个字符串会匹配出来
.com.xiaowang@qq.com # ---不符合要求
字符 | 功能 |
^ | 匹配字符串开头 |
$ | 匹配字符串结尾 |
| | 匹配左右任意一个表达式 |
(ab) | 将括号中字符作为一个分组 |
\num | 引用分组num匹配到的字符串 |
(?P<name>) | 分组起别名 |
(?P=name) | 引用别名为name分组匹配到的字符串 |
[\u4e00-\u9fa5] //匹配中文字符
^[1-9]\d*$ //匹配正整数
^[A-Za-z]+$ //匹配由26个英文字母组成的字符串
^[A-Z]+$ //匹配由26个英文字母的大写组成的字符串
^[a-z]+$ //匹配由26个英文字母的小写组成的字符串
^[A-Za-z0-9]+$ //匹配由数字和26个英文字母组成的字符串
2、需求:不是以4、7结尾的手机号码(11位)
import re
tels = ["13100001234", "18912344321", "10086", "18800007777"]
for tel in tels:
ret = re.match("1\d{9}[0-3,5-6,8-9]", tel)
if ret:
print(ret.group())
else:
print("%s 不是想要的手机号" % tel)
结果
13100001234 不是想要的手机号
18912344321
10086 不是想要的手机号
18800007777 不是想要的手机号
3、需求:匹配出163、126、qq邮箱
#coding=utf-8
import re
ret = re.match("\w{4,20}@163\.com", "test@163.com”)
print(ret.group())
# 结果: test@163.com
ret = re.match("\w{4,20}@(163|126|qq)\.com", "test@gmail.com")
if ret:
print(ret.group())
else:
print("不是163、126、qq邮箱")
# 结果: 不是163、126、qq邮箱
4、需求:提取区号和电话号码
import re
ret = re.match("([^-]*)-(\d+)", "010-12345678")
print(ret.group())
print(ret.group(1))
print(ret.group(2))
结果如下:
010-12345678
010
12345678
^在[ ]里面代表非的含义:
例如:
[^-]* *代表前所有字符0个或者多个,非-的字符串
[^abc] 代表非a、且非b 、且非c的字符
1、正则表达式中,\d 匹配一个数字字符。等价于 [0-9]。
2、相反地,正则表达式中,\D 匹配一个非数字字符。等价于 [^0-9]。
5、需求:匹配出0-100之间的数字
import re
ret = re.match("[1-9]?\d","8”) # ?匹配前面的字符出现1次或者0次 类似78也可以匹配
print(ret.group())
# 结果:8
ret = re.match("[1-9]?\d$|100","78")
print(ret.group())
# 结果: 78
ret = re.match("[1-9]?\d$|100","100")
print(ret.group())
# 结果: 100
\w 匹配字母或数字或下划线或汉字(具体与字符集有关),^\w 表示相反匹配。
import re
s = "string. With. Punctuation?"
# 如果空白符也需要过滤,使用 r'[^\w]'
s = re.sub(r'[^\w\s]','',s)
re.split
s = "标准黑 标准白 油黄色,珍珠白油黄色,标准黑-1;等,红芽粉-7,深鸢尾蓝,如图"
color_list = re.split("[,, ]", s)
color_list
['标准黑', '标准白', '油黄色', '珍珠白油黄色', '标准黑-1;等', '红芽粉-7', '深鸢尾蓝', '如图']