Python3正则表达式

最新推荐文章于 2021-11-18 17:08:43 发布

xwq_notes

最新推荐文章于 2021-11-18 17:08:43 发布

阅读量284

点赞数

本文链接：https://blog.csdn.net/xwq_notes/article/details/78460298

版权

Python3正则表达式
解释：它是一个特殊的字符序列，能帮助你方便的检查一个字符串是否与某种模式匹配。
Python 自1.5版本起就有了re 模块，只要导入re模块就可以使用全部的正则表达式。

正则表达式模式语法中的常用特殊元素：
^ 匹配字符串的开头
$ 匹配字符串的末尾
re* 匹配0个或多个的表达式
re+ 匹配1个或多个的表达式
re? 匹配0个或1个由前面的正则表达式定义的片段，非贪婪方式
re{ n, m} 匹配 n 到 m 次由前面的正则表达式定义的片段，贪婪方式
a| b 匹配a或b

字符类
[Aa]bcd 匹配 "Abcd" 或 "abcd"
abc[de] 匹配 "abcd" 或 "abce"
[abcd] 匹配中括号内的任意一个字母
[0-9] 匹配任何数字
[a-z] 匹配任何小写字母
[A-Z] 匹配任何大写字母
[a-zA-Z0-9] 匹配任何字母及数字
[^abcd] 除了aeiou字母以外的所有字符
[^0-5] 匹配除了数字外的字符

特殊字符类
. 匹配任意字符，除了换行符
\s 一个空格
\S 一个非空格
\d 表示一个数字
\D 表示一个非数字
\w 任意字母数字
\W 非字母数字

re.match函数：尝试从字符串的起始位置匹配一个模式，如果不是起始位置匹配成功的话，match()就返回none
语法：
re.match(pattern, string, flags=0) #pattern：匹配的正则表达式，string：要匹配的字符串，flags：标志位，用于控制正则表达式的匹配方式
我们可以使用group(num) 或 groups() 匹配对象函数来获取匹配表达式
group(num=0) 匹配的整个表达式的字符串，group() 可以一次输入多个组号，在这种情况下它将返回一个包含那些组所对应值的元组。
groups() 返回一个包含所有小组字符串的元组，从 1 到所含的小组号

代码演示：
import re
s = "i am student"
r = r".*(am).*"
p = re.match(r,s)
print(p)
print(p.group())

运行结果：
<_sre.SRE_Match object; span=(0, 12), match='i am student'>
i am student

re.search方法:扫描整个字符串并返回第一个成功的匹配
语法：
re.search(pattern, string, flags=0) #参数意思和上面参数意思一样
代码演示：
import re
s = "i am student"
r1 = r".*(student).*"
p1 = re.search(r1,s)
print(p1.span())
运行结果：
(0, 12)

re.sub：用于替换字符串中的匹配项（简称检索和替换）。
语法：
re.sub(pattern, repl, string, count=0)
参数：
pattern : 正则中的模式字符串,
repl : 替换的字符串，也可为一个函数,
string : 要被查找替换的原始字符串,
count : 模式匹配后替换的最大次数，默认 0 表示替换所有的匹配

代码演示：
import re
phone = "182 0556 7502"
r = r"0556"
print(re.sub(r,"***",phone))
运行结果：
182 *** 7502