# 正则表达式的定义和规则
''''
正则表达式,就是使用字符,转义字符和特殊字符组成一个规则,
使用这个规则对文本的内容完成一个搜索或匹配或替换的功能
正则表达式的组成
普通字符:大小写字母,数字,组合。。。
转义字符:\w \W \d \D \s \S...
特殊字符:. * ? + ^ $ [] {} ()
匹配模式:I U 。。。
'''
import re
# 普通字符
# vars = '123456abcdefg'
# reg = 'ab'
# res = re.search(reg, vars).group()
# print(res)
# 转移字符
# \w 单个字母,数字,下划线
# \W 单个 非 字母,数字,下划线
# \d 单个的数字
# \D 单个 非 的数字
# \s 单个 空格符或制表符
# \S 单个 非 空格符或制表符
# vars = 'abc123abcde12345'
# reg = '\s'
# res = re.search(reg, vars).group()
# print(res)
# 特殊字符
# . 单个的任意字符,除了换行符之外
# * 代表匹配次数 任意次数(包括零次)
# 特点:如果使用*号,那么在匹配的开始处如果符合要求,
# 则按照规则一直向后匹配,直到不符合规则结束并把前面符合的数据返回
# 如果在匹配的开始处就不符合要求,则直接返回,匹配到的次数为0
# + 代表匹配次数 至少要求匹配一次
# ? '\d+?' 拒绝贪婪,就是前面的匹配规则只要达成则返回
# {} 指定匹配次数 {3}必须匹配三次 {2,5} 必须匹配2到5次
# [] 代表字符的范围 [a-z,0-9,_]
# () 代表子组,括号中的表达式首先作为整个正则的一部分,另外会把符合小括号的内容单独提取
# ^ 代表开头
# $ 代表结尾 '^1\d{10}$'
# vars = 'abc123abcde12345'
# reg = '\d{3}'
# res = re.search(reg, vars).group()
# print(res, len(res))
# 正则模式
# re.I 不区分大小写
# 。。。
# 。。。
python正则re表达式的定义和规则
最新推荐文章于 2024-02-20 12:03:54 发布