正则简单用法

最新推荐文章于 2022-08-20 15:12:24 发布

Leon_Kbl

最新推荐文章于 2022-08-20 15:12:24 发布

阅读量228

点赞数

分类专栏： python基础

本文链接：https://blog.csdn.net/Leon_Kbl/article/details/97009107

版权

python基础专栏收录该内容

5 篇文章 0 订阅

订阅专栏

re的简单方法介绍及用法

正则表达式：
是一个特殊的字符序列，它能帮助你方便的检查一个字符串是否与某种模式匹配

re.compile函数：
compile函数用于编译正则表达式，生成一个正则表达式对象，供match和search()这俩个函数使用

# import re
# ret1=re.compile(r"\d+").findall("hdf123123fdhg1235")
# print(ret1)
# # 返回列表

re.match与re.search的区别：

re.match函数尝试从字符串的起始位置匹配一个模式，如果不是起始位置匹配成功的话，match()就返回none

re.search扫描整个字符串并返回第一个成功的匹配，匹配成功re.search方法返回一个匹配对象，否则返回None

. 匹配任意1个字符（除了\n）

# import re
# ret=re.match("a.c","a&c")
# if ret:
#     print(ret.group())
# else:
#     print("匹配失败")

[] 匹配[ ]中列举的字符

# import re
# ret=re.match("a[dfg]c","afc")
# if ret:
#     print(ret.group())
# else:
#     print("匹配失败")

\d 匹配数字，即0-9

# import re
# ret=re.match("a\dc","a5c")
# if ret:
#     print(ret.group())
# else:
#     print("匹配失败")

\D 匹配非数字，即不是数字

import re
# ret=re.match("a\Dc","agc")
# if ret:
#     print(ret.group())
# else:
#     print("匹配失败")

\s 匹配空白，即空格，tab键注意\s是只能匹配一个空格

# import re
# ret=re.match("a\sc","a c")
# if ret:
#    print(ret.group())
# else:
#    print("匹配失败")

\S 匹配非空白注意\n不能匹配，因为\n后面有很多空格

# import re
# ret=re.match("a\Sc","a\nc")
# if ret:
#     print(ret.group())
# else:
#     print("匹配失败")

\w 匹配单词字符，即a-z、A-Z、0-9、_

# import re
# ret=re.match("a\wc","a_c")
# if ret:
#     print(ret.group())
# else:
#     print("匹配失败")

\W 匹配非单词字符

# import re
# ret=re.match("a\Wc","a*c")
# if ret:
#     print(ret.group())
# else:
#     print("匹配失败")

* 匹配前一个字符出现0次或者无限次，即可有可无也叫贪婪模式

# import re
# ret=re.match("ab*c","abbbbc")
# if ret:
#     print(ret.group())
# else:
#     print("匹配失败")

+ 匹配前一个字符出现1次或者无限次，即至少有1次贪婪模式匹配

# import re
# ret=re.match("ab+c","abbbc")
# if ret:
#     print(ret.group())
# else:
#     print("匹配失败")

? 匹配前一个字符出现1次或者0次，即要么有1次，要么没有非贪婪模式

# import re
# ret=re.match("ab?c","abc")
# if ret:
#     print(ret.group())
# else:
#     print("匹配失败")

{n} 匹配前一个字符出现m次

# import re
# ret=re.match("abc{3}","abccccc")
# if ret:
#     print(ret.group())
# else:
#     print("匹配失败")

{m,n} 匹配前一个字符出现从m到n次

# import re
# ret=re.match("abc{3,5}","abccccccccc")   #当尖括号放在最后时，可以匹配到有限的范围
# if ret:
#     print(ret.group())
# else:
#     print("匹配失败")


#
# import re
# ret=re.match("abc{,5}","abccccccccc")           #没有下限
# if ret:
#     print(ret.group())
# else:
#     print("匹配失败")


# import re
# ret=re.match("abc{3,}","abccccccccc")     #没有上限，（贪婪模式）
# if ret:
#     print(ret.group())
# else:
#     print("匹配失败")

匹配邮箱

# import re
# ret=re.match("\w{4,20}@163.com","dgshjd@163.com")
# if ret:
#     print(ret.group())
# else:
#     print("匹配失败")


# import re
# ret=re.match("^1[3-8]\d{8}8$","15735169048")
# if ret:
#     print(ret.group())
# else:
#     print("匹配失败")


# import re
# ret=re.match("\w{4,20}@168\.com","gfjdsh@168.com")    #注意这里\.转义，使得.不代表任何字符，只代表字符.
# if ret:
#     print(ret.group())
# else:
#     print("匹配失败")

匹配手机号，号段3-9，不以47结尾

# import re
# ret=re.match("^1[3-9]\d{8}[1-35-68-9]$","15233638286")
# if ret:
#     print(ret.group())
# else:
#     print("匹配失败")


# import re
# ret=re.match("^1[3-9]\d{8}[^47]$","15233638286")  #不以47j结尾
# if ret:
#     print(ret.group())
# else:
#     print("匹配失败")

匹配多个邮箱中正确的邮箱

分组（）

# email_list=["xiaowang@163.com","xiaowang@163comheihei","com.xiaowang@qq.com"]
# import re
# for email in email_list:
#     ret=re.match("\w{4,20}@(163|qq)(\.com)$",email)       #注意这里遍历的东西不需要再加引号
#     if ret:
#         print("%s是正确邮箱"% ret.group())
#     else:
#         print("%s不是正确邮箱"% email)

| 匹配左右任意一个表达式
(a,b) 将括号中字符作为一个分组
\num 引用分组num匹配到的字符串
(?P) 分组起别名
(?P=name) 引用别名为name分组匹配到的字符串

# import re
# ret=re.match(r"<(\w+)>\w+</\1>","<html>hh</html>")
# if ret:
#     print(ret.group())
# else:
#     print("匹配失败")



# import re
# ret=re.match(r"<([a-z]+)><(\w+)><(\w+)>\w+</\3></\2></\1>","<html><h1><h2>hh</h2></h1></html>")

（）分组，后面调组按顺序对应调用数字组

# if ret:
#     print(ret.group())
# else:
#     print("匹配失败")


# import re
# ret=re.match(r"<(?P<stone>[a-z]+)><(?P<ST>\w+)><(?P<XIN>\w+)>\w+</(?P=XIN)></(?P=ST)></(?P=stone)>","<html><h1><h2>hh</h2></h1></html>")
# if ret:
#     print(ret.group())
# else:
#     print("匹配失败")

用正则表达式匹配出， < html > < title > gao123456XX @ foxmail.com < / title > < / html > YY
注：XX不能以4,7结尾, YY不以NO结尾使用(?P）分组起别名的方式来做

# import re
# ret=re.match(r"<(?P<n1>[a-z]+)><(?P<n2>[a-z]+)>[a-z0-9]{9}[^47]{2}@foxmail\.com</(?P=n2)></(?P=n1)>[^NO]+$","<html><title>gao12345648@foxmail.com</title></html>hj")
# if ret:
#     print(ret.group())
# else:
#     print("匹配失败")

r 的使用建议：
Python中字符串前面加上r表示原生字符串，与大多数编程语言相同，
正则表达式里使用"“作为转义字符，这就是可能造成反斜杠困扰。
假如你需要匹配文本中的字符”"，那么使用编程语言表示的正则表达式里将需要4个反斜杠"\\"：
前两个和后两个分别用于在编程语言里转义成反斜杠，
转换成两个反斜杠后再在正则表达式里转义成一个反斜杠。
Python里的原生字符串很好的解决了这个问题，这个例子中的正则表达式可以使用r’\\'表示。
同样，匹配一个数字的"\d"可以写成r"\d"。
有了原生字符串，就不用担心是不是漏写了反斜杠，写出来的表达式也更直观。

Leon_Kbl

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
正则简单用法

re的简单方法介绍及用法正则表达式：是一个特殊的字符序列，它能帮助你方便的检查一个字符串是否与某种模式匹配re.compile函数：compile函数用于编译正则表达式，生成一个正则表达式对象，供match和search()这俩个函数使用# import re# ret1=re.compile(r"\d+").findall("hdf123123fdhg1235")# print(r...
复制链接

扫一扫