正则表达式
一、匹配符号
“”"
- re模块
re模块是python提供的专门用支持正则表达式的一个模块
fullmatch函数:
fullmatch(正则表达式,字符串) – 让正则表达式和指定字符串进行完全匹配,如果匹配失败返回None;
“”"
“”"
2. 正则语法
正则表达式 – 正则表达式是一个字符串复杂问题变得简单的工具。
写正则表达式的主要工作:用正则符号描述清楚相关字符串的规则。
python正则表示方式:r’正则表达式’
js的正则:/正则表达式/
“”"
from re import fullmatch
“”"
- 普通字符(普通符号)
在正则除了有特殊功能或者特殊意义以外的符号;
普通字符在正则中表示这个符号本身。
“”"
# 匹配一个字符串有三个字符分别是a, b和c
re_str = r'abc'
print(fullmatch(re_str, 'abc'))
“”"
2) . – 匹配任意一个字符
注意:一个.只能匹配一个任意字符
“”"
# 匹配一个字符,长度是三,第一个字符是a,最后一个字符是c,a和c之间是任意一个字符
re_str = r'a.c'
print(fullmatch(re_str, 'abc'))
print(fullmatch(re_str, 'a+c'))
print(fullmatch(re_str, 'a好c'))
re_str = r'abc...'
print(fullmatch(re_str, 'abcm./'))
print(fullmatch(re_str, 'abcm\t/'))
print(fullmatch(re_str, 'abc G/'))
“”"
3) \d – 匹配任意一个数字字符
“”"
re_str = r'a\d\dc'
print(fullmatch(re_str, 'a78c'))
print(fullmatch(re_str, 'a00c'))
“”"
4) \s – 匹配任意一个空白字符
空白字符:空格、回车(\n)、制表符(\t)
“”"
re_str = r'a\sb'
print(fullmatch(re_str, 'a b'))
print(fullmatch(re_str, 'a\nb'))
print(fullmatch(re_str, 'a\tb'))
print(fullmatch(re_str, 'a b')) # None(不匹配)
“”"
-
- \w – 匹配任意一个字母、数字或者下划线 (不好用)
“”"
- \w – 匹配任意一个字母、数字或者下划线 (不好用)
“”"
6)
\D – 匹配任意一个非数字字符
\S – 匹配任意一个非空白字符
“”"
print(fullmatch(r'a\Sb\D', 'a>b='))
print(fullmatch(r'a\Sb\D', 'a b=')) # None
print(fullmatch(r'a\Sb\D', 'a>b0')) # None
“”"
7) [字符集] – 匹配字符集中任意一个字符
注意:一个[]只能匹配一个字符
[多个普通字符] – 例如[abc], 可以匹配a或者b或者c
[包含\开头的特殊符号字符集] – 例如:[\dabc], 可以匹配任意数字或者a或者b或者c
[包含减号在两个字符之间的字符集] – 这个时候的减号表示谁到谁(注意:减号前面的字符的编码必须小于减号后面的)
例如:
[a-z] – 匹配任意一个小写字母
[a-d] – 匹配a、b、c、d中的任意一个字符
[A-Z] - 匹配任意一个大写字母
[1-9] – 匹配1到9中任意一个数字字符
[\u4e00-\u9fa5] – 匹配任意一个中文字符
[a-zA-Z]、[A-Za-z] – 匹配任意一个字母
[a-z123] – 匹配任意一个小写字母,或者1或者2或者3
[a-z\d] – 匹配任意一个小写字母或者任意一个数字
“”"
re_str = r'a[xym]b'
print(fullmatch(re_str, 'axb'))
print(fullmatch(re_str, 'ayb'))
print(fullmatch(re_str, 'amb'))
print(fullmatch(re_str, 'azb')) # None
re_str = r'a[16]b'
print(fullmatch(re_str, 'a1b'))
print(fullmatch(re_str, 'a6b'))
re_str = r'a[a\db]b'
print(fullmatch(re_str, 'a1b'))
print(fullmatch(re_str, 'aab'))
print(fullmatch(re_str, 'abb'))
print(fullmatch(r'x[a-z]y', 'xmy'))
print(fullmatch(r'x[a-zA-Z]y', 'xmy'))
print(fullmatch(r'x[a-zA-Z]y', 'xKy'))
print(fullmatch(r'x[a-zA-Z*&]y', 'x*y'))
print(fullmatch(r'x[a-zA-Z*&]y', 'xMy'))
print(fullmatch(r'x[0-9]y', 'x5y'))
print(fullmatch(r'x[-09]y', 'x-y'))
print(fullmatch(r'x[-09]y', 'x0y'