Python3正则表达式
解释:它是一个特殊的字符序列,能帮助你方便的检查一个字符串是否与某种模式匹配。
Python 自1.5版本起就有了re 模块,只要导入re模块就可以使用全部的正则表达式。
正则表达式模式语法中的常用特殊元素:
^ 匹配字符串的开头
$ 匹配字符串的末尾
re* 匹配0个或多个的表达式
re+ 匹配1个或多个的表达式
re? 匹配0个或1个由前面的正则表达式定义的片段,非贪婪方式
re{ n, m} 匹配 n 到 m 次由前面的正则表达式定义的片段,贪婪方式
a| b 匹配a或b
字符类
[Aa]bcd 匹配 "Abcd" 或 "abcd"
abc[de] 匹配 "abcd" 或 "abce"
[abcd] 匹配中括号内的任意一个字母
[0-9] 匹配任何数字
[a-z] 匹配任何小写字母
[A-Z] 匹配任何大写字母
[a-zA-Z0-9] 匹配任何字母及数字
[^abcd] 除了aeiou字母以外的所有字符
[^0-5] 匹配除了数字外的字符
特殊字符类
. 匹配任意字符,除了换行符
\s 一个空格
\S 一个非空格
\d 表示一个数字
\D 表示一个非数字
\w 任意字母数字
\W 非字母数字
re.match函数:尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none
语法:
re.match(pattern, string, flags=0) #pattern:匹配的正则表达式,string:要匹配的字符串,flags:标志位,用于控制正则表达式的匹配方式
我们可以使用group(num) 或 groups() 匹配对象函数来获取匹配表达式
group(num=0) 匹配的整个表达式的字符串,group() 可以一次输入多个组号,在这种情况下它将返回一个包含那些组所对应值的元组。
groups() 返回一个包含所有小组字符串的元组,从 1 到 所含的小组号
代码演示:
import re
s = "i am student"
r = r".*(am).*"
p = re.match(r,s)
print(p)
print(p.group())
运行结果:
<_sre.SRE_Match object; span=(0, 12), match='i am student'>
i am student
re.search方法:扫描整个字符串并返回第一个成功的匹配
语法:
re.search(pattern, string, flags=0) #参数意思和上面参数意思一样
代码演示:
import re
s = "i am student"
r1 = r".*(student).*"
p1 = re.search(r1,s)
print(p1.span())
运行结果:
(0, 12)
re.sub:用于替换字符串中的匹配项(简称检索和替换)。
语法:
re.sub(pattern, repl, string, count=0)
参数:
pattern : 正则中的模式字符串,
repl : 替换的字符串,也可为一个函数,
string : 要被查找替换的原始字符串,
count : 模式匹配后替换的最大次数,默认 0 表示替换所有的匹配
代码演示:
import re
phone = "182 0556 7502"
r = r"0556"
print(re.sub(r,"***",phone))
运行结果:
182 *** 7502
解释:它是一个特殊的字符序列,能帮助你方便的检查一个字符串是否与某种模式匹配。
Python 自1.5版本起就有了re 模块,只要导入re模块就可以使用全部的正则表达式。
正则表达式模式语法中的常用特殊元素:
^ 匹配字符串的开头
$ 匹配字符串的末尾
re* 匹配0个或多个的表达式
re+ 匹配1个或多个的表达式
re? 匹配0个或1个由前面的正则表达式定义的片段,非贪婪方式
re{ n, m} 匹配 n 到 m 次由前面的正则表达式定义的片段,贪婪方式
a| b 匹配a或b
字符类
[Aa]bcd 匹配 "Abcd" 或 "abcd"
abc[de] 匹配 "abcd" 或 "abce"
[abcd] 匹配中括号内的任意一个字母
[0-9] 匹配任何数字
[a-z] 匹配任何小写字母
[A-Z] 匹配任何大写字母
[a-zA-Z0-9] 匹配任何字母及数字
[^abcd] 除了aeiou字母以外的所有字符
[^0-5] 匹配除了数字外的字符
特殊字符类
. 匹配任意字符,除了换行符
\s 一个空格
\S 一个非空格
\d 表示一个数字
\D 表示一个非数字
\w 任意字母数字
\W 非字母数字
re.match函数:尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none
语法:
re.match(pattern, string, flags=0) #pattern:匹配的正则表达式,string:要匹配的字符串,flags:标志位,用于控制正则表达式的匹配方式
我们可以使用group(num) 或 groups() 匹配对象函数来获取匹配表达式
group(num=0) 匹配的整个表达式的字符串,group() 可以一次输入多个组号,在这种情况下它将返回一个包含那些组所对应值的元组。
groups() 返回一个包含所有小组字符串的元组,从 1 到 所含的小组号
代码演示:
import re
s = "i am student"
r = r".*(am).*"
p = re.match(r,s)
print(p)
print(p.group())
运行结果:
<_sre.SRE_Match object; span=(0, 12), match='i am student'>
i am student
re.search方法:扫描整个字符串并返回第一个成功的匹配
语法:
re.search(pattern, string, flags=0) #参数意思和上面参数意思一样
代码演示:
import re
s = "i am student"
r1 = r".*(student).*"
p1 = re.search(r1,s)
print(p1.span())
运行结果:
(0, 12)
re.sub:用于替换字符串中的匹配项(简称检索和替换)。
语法:
re.sub(pattern, repl, string, count=0)
参数:
pattern : 正则中的模式字符串,
repl : 替换的字符串,也可为一个函数,
string : 要被查找替换的原始字符串,
count : 模式匹配后替换的最大次数,默认 0 表示替换所有的匹配
代码演示:
import re
phone = "182 0556 7502"
r = r"0556"
print(re.sub(r,"***",phone))
运行结果:
182 *** 7502