Python正则表达式 re 用法

最新推荐文章于 2022-08-02 05:34:59 发布

"灼灼其华"

最新推荐文章于 2022-08-02 05:34:59 发布

阅读量1.6k

点赞数

分类专栏： python

本文链接：https://blog.csdn.net/weixin_44285715/article/details/107515136

版权

python 专栏收录该内容

23 篇文章 1 订阅

订阅专栏

re模块:匹配开头/结尾(^/$) https://blog.csdn.net/chenmozhe22/article/details/80602000

re模块的基础用法 https://blog.csdn.net/chenmozhe22/article/details/80601971

1、需求：匹配163.com的邮箱地址

email_list = ["xiaoWang@163.com", "xiaoWang@163.comheihei", ".com.xiaowang@qq.com"]

for email in email_list:
    ret = re.match("[\w]{4,20}@163\.com$", email) \.代表只是一个点 $代表以xxx结尾的字符串
    if ret:
        print("%s ---是符合规定的邮件地址” % email）
    else:
        print("%s ---不符合要求" % email)

结果

xiaoWang@163.com            # ---是符合规定的邮件地址
xiaoWang@163.comheihei      # ---不符合要求   # 如果没有$，这个字符串会匹配出来
.com.xiaowang@qq.com        # ---不符合要求

字符	功能
^	匹配字符串开头
$	匹配字符串结尾
\|	匹配左右任意一个表达式
(ab)	将括号中字符作为一个分组
\num	引用分组num匹配到的字符串
(?P<name>)	分组起别名
(?P=name)	引用别名为name分组匹配到的字符串

[\u4e00-\u9fa5] //匹配中文字符

^[1-9]\d*$    //匹配正整数
^[A-Za-z]+$   //匹配由26个英文字母组成的字符串
^[A-Z]+$      //匹配由26个英文字母的大写组成的字符串
^[a-z]+$      //匹配由26个英文字母的小写组成的字符串

^[A-Za-z0-9]+$ //匹配由数字和26个英文字母组成的字符串

2、需求：不是以4、7结尾的手机号码（11位）

import re
tels = ["13100001234", "18912344321", "10086", "18800007777"]
 
for tel in tels:
    ret = re.match("1\d{9}[0-3,5-6,8-9]", tel)
    if ret:
        print(ret.group())
    else:
        print("%s 不是想要的手机号" % tel)

结果

13100001234 不是想要的手机号
18912344321
10086 不是想要的手机号
18800007777 不是想要的手机号

3、需求：匹配出163、126、qq邮箱

#coding=utf-8
 
import re
 
ret = re.match("\w{4,20}@163\.com", "test@163.com”)  
print(ret.group())                               
# 结果： test@163.com
ret = re.match("\w{4,20}@(163|126|qq)\.com", "test@gmail.com")
if ret:
    print(ret.group())
else:
    print("不是163、126、qq邮箱")                  
# 结果： 不是163、126、qq邮箱

4、需求：提取区号和电话号码

import re
 
ret = re.match("([^-]*)-(\d+)", "010-12345678")
 
print(ret.group())
print(ret.group(1))
print(ret.group(2))

结果如下：

010-12345678
010
12345678

^在[ ]里面代表非的含义:
例如：
[^-]*   *代表前所有字符0个或者多个，非-的字符串

[^abc]  代表非a、且非b 、且非c的字符


1、正则表达式中，\d 匹配一个数字字符。等价于 [0-9]。

2、相反地，正则表达式中，\D 匹配一个非数字字符。等价于 [^0-9]。

5、需求：匹配出0-100之间的数字

import re
 
ret = re.match("[1-9]?\d","8”) # ?匹配前面的字符出现1次或者0次 类似78也可以匹配
print(ret.group())  

# 结果：8


ret = re.match("[1-9]?\d$|100","78")
print(ret.group())                          
 
# 结果： 78
 
 
ret = re.match("[1-9]?\d$|100","100")
print(ret.group())                         
 
# 结果： 100

\w 匹配字母或数字或下划线或汉字（具体与字符集有关），^\w 表示相反匹配。

import re
s = "string. With. Punctuation?"
# 如果空白符也需要过滤，使用 r'[^\w]'
s = re.sub(r'[^\w\s]','',s)

re.split

s = "标准黑 标准白 油黄色,珍珠白油黄色,标准黑-1；等,红芽粉-7,深鸢尾蓝，如图"
color_list = re.split("[，, ]", s)
color_list

['标准黑', '标准白', '油黄色', '珍珠白油黄色', '标准黑-1；等', '红芽粉-7', '深鸢尾蓝', '如图']

"灼灼其华"

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Python正则表达式 re 用法

[\u4e00-\u9fa5]//匹配中文字符^[1-9]\d*$//匹配正整数^[A-Za-z]+$//匹配由26个英文字母组成的字符串^[A-Z]+$//匹配由26个英文字母的大写组成的字符串^[a-z]+$//匹配由26个英文字母的小写组成的字符串^[A-Za-z0-9]+$//匹配由数字和26个英文字母组成的字符串re模块的基础用法https://blog.csdn.net/chenmozhe22/article/details/80...
复制链接

扫一扫

专栏目录