Python正则表达式 re 用法

re模块:匹配开头/结尾(^/$) https://blog.csdn.net/chenmozhe22/article/details/80602000

re模块的基础用法 https://blog.csdn.net/chenmozhe22/article/details/80601971

 

1、需求:匹配163.com的邮箱地址

email_list = ["xiaoWang@163.com", "xiaoWang@163.comheihei", ".com.xiaowang@qq.com"]

for email in email_list:
    ret = re.match("[\w]{4,20}@163\.com$", email) \.代表只是一个点 $代表以xxx结尾的字符串
    if ret:
        print("%s ---是符合规定的邮件地址” % email)
    else:
        print("%s ---不符合要求" % email)

结果

xiaoWang@163.com            # ---是符合规定的邮件地址
xiaoWang@163.comheihei      # ---不符合要求   # 如果没有$,这个字符串会匹配出来
.com.xiaowang@qq.com        # ---不符合要求
字符功能
^匹配字符串开头
$匹配字符串结尾
|匹配左右任意一个表达式
(ab)将括号中字符作为一个分组
\num引用分组num匹配到的字符串
(?P<name>)分组起别名
(?P=name)引用别名为name分组匹配到的字符串
[\u4e00-\u9fa5] //匹配中文字符

^[1-9]\d*$    //匹配正整数
^[A-Za-z]+$   //匹配由26个英文字母组成的字符串
^[A-Z]+$      //匹配由26个英文字母的大写组成的字符串
^[a-z]+$      //匹配由26个英文字母的小写组成的字符串

^[A-Za-z0-9]+$ //匹配由数字和26个英文字母组成的字符串 

2、需求:不是以4、7结尾的手机号码(11位)

import re
tels = ["13100001234", "18912344321", "10086", "18800007777"]
 
for tel in tels:
    ret = re.match("1\d{9}[0-3,5-6,8-9]", tel)
    if ret:
        print(ret.group())
    else:
        print("%s 不是想要的手机号" % tel)

 结果

13100001234 不是想要的手机号
18912344321
10086 不是想要的手机号
18800007777 不是想要的手机号

3、需求:匹配出163、126、qq邮箱

#coding=utf-8
 
import re
 
ret = re.match("\w{4,20}@163\.com", "test@163.com”)  
print(ret.group())                               
# 结果: test@163.com
ret = re.match("\w{4,20}@(163|126|qq)\.com", "test@gmail.com")
if ret:
    print(ret.group())
else:
    print("不是163、126、qq邮箱")                  
# 结果: 不是163、126、qq邮箱

4、需求:提取区号和电话号码

import re
 
ret = re.match("([^-]*)-(\d+)", "010-12345678")
 
print(ret.group())
print(ret.group(1))
print(ret.group(2))

结果如下:

010-12345678
010
12345678
^在[ ]里面代表非的含义:
例如:
[^-]*   *代表前所有字符0个或者多个,非-的字符串

[^abc]  代表非a、且非b 、且非c的字符


1、正则表达式中,\d 匹配一个数字字符。等价于 [0-9]。

2、相反地,正则表达式中,\D 匹配一个非数字字符。等价于 [^0-9]。

5、需求:匹配出0-100之间的数字

import re
 
ret = re.match("[1-9]?\d","8”) # ?匹配前面的字符出现1次或者0次 类似78也可以匹配
print(ret.group())  

# 结果:8


ret = re.match("[1-9]?\d$|100","78")
print(ret.group())                          
 
# 结果: 78
 
 
ret = re.match("[1-9]?\d$|100","100")
print(ret.group())                         
 
# 结果: 100
\w 匹配字母或数字或下划线或汉字(具体与字符集有关),^\w 表示相反匹配。

import re
s = "string. With. Punctuation?"
# 如果空白符也需要过滤,使用 r'[^\w]'
s = re.sub(r'[^\w\s]','',s)

re.split

s = "标准黑 标准白 油黄色,珍珠白油黄色,标准黑-1;等,红芽粉-7,深鸢尾蓝,如图"
color_list = re.split("[,, ]", s)
color_list

['标准黑', '标准白', '油黄色', '珍珠白油黄色', '标准黑-1;等', '红芽粉-7', '深鸢尾蓝', '如图']
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值