正则表达式
re模块
python提供专门用来支持正则表达式的一个模块
正则语法 - 是让字符串复杂问题变得简单的工具
""" python正则表达式:r'正则表达式' 匹配字符 . - 匹配任意一个字符 \d - 匹配一个数字 \s - 匹配任意一个空白字符 空格、回车\n、制表符\t \D - 匹配任意一个非数字 \S - 匹配任意一个非空白字符 \w - 匹配任意一个字母、数字或下划线 [字符集] - 匹配字符集中的任意一个字符 [a-z] [\babc] [^字符集] - 匹配不在字符集中的任意一个字符 """
检测类符号
""" 检测类符号的存在不影响被匹配的字符串长度,它的作用是在匹配成功的前提下检测符号所有在的位置符合要求 检测类符号的用法: 先去掉检测类符号,看是否能匹配成功,如果失败整个正则匹配失败,如果成功再看检测符号所在的位置是否符合要求 \b - 检测是否是单词边界 单词边界 - 能够区分两个不同单词的符号都是单词边界,例如: 空白 标点符号 字符串开头字符串结尾 \B - 检测是否是非单词边界 ^ - 检测是否是字符串开头 $ - 检测是否是字符串结尾
“”"
匹配次数
""" * - 匹配0次或者多次(任意次数) + - 匹配1次或者多次(至少一次) ? - 匹配0次或1次 {N} - 匹配N次 {M,N} 匹配M到N次 {,N} - 匹配最多N次 {M,} - 匹配至少M次 # 注意 匹配次数对应的符号前面必须是匹配类符号 """
分组和分支
""" () - 分组 作用1:将()中的内容作为一个整体,进行整体相关操作,例如:整体控制次数 作用2:通过'\M' 重复前面第M个分组匹配到的结果,M从1开始 作用3:捕获(findall) | - 分支 正则1|正则2 - 先用正则1进行匹配如果直接,如果成功就直接匹配成功,如果失败再用正则2进行匹配 3. 转义符号 在特殊符号前加\,让符号的功能消失,变成一个普通符号 独立存在有特殊功能的符号,将符号放入[]中其功能也会自动消失 """
re模块
""" fuiimatch() macth() search() findall() finiter() split() sub() flags参数 # 上面的每一个函数都有一个参数flags,用来设置正则参数 # 1) 单行匹配和多行匹配参数:re.S/ re.M(默认的) # 单行匹配:.可以匹配\n # 多行匹配:.不能和\n匹配 # flags=re.S == r'(?s)正则表达式' # flags=re.S|re.I == r'(?is)正则表达式' # 2) 忽略大小写:re.I """
利用正则表达式完成下面的操作:
一、不定项选择题
- 能够完全匹配字符串
"(010)-62661617"
和字符串"01062661617"
的正则表达式包括(A )
A.r"\(?\d{3}\)?-?\d{8}"
B. r"[0-9()-]+"
C.r"[0-9(-)]*\d*"
D.r"[(]?\d*[)-]*\d*"
-
能够完全匹配字符串“back”和“back-end”的正则表达式包括( B)
A. r“\w{4}-\w{3}|\w{4}”
B. r“\w{4}|\w{4}-\w{3}”
C.r “\S±\S+|\S+”
D. r“\w*\b-\b\w*|\w*” -
能够完全匹配字符串“go go”和“kitty kitty”,但不能完全匹配“go kitty”的正则表达式包括(A)
A.r “\b(\w+)\b\s+\1\b”
B. r“\w{2,5}\s*\1”
C. r“(\S+) \s+\1”
D. r“(\S{2,5})\s{1,}\1” -
能够在字符串中匹配“aab”,而不能匹配“aaab”和“aaaab”的正则表达式包括(B )
A. r“a*?b”
B. r“a{,2}b”
C. r“aa??b”
D. r“aaa??b”
二、编程题
1.用户名匹配
要求: 1.用户名只能包含数字 字母 下划线
2.不能以数字开头
3.⻓度在 6 到 16 位范围内
r'[a-zA-Z_]\w{5,15}'
- 密码匹配
要求: 1.不能包含!@#¥%^&*这些特殊符号
2.必须以字母开头
3.⻓度在 6 到 12 位范围内
result = re.fullmatch(r'[a-zA-Z][^!@#¥%^&*]{5,11}','a12ddc9')
- ipv4 格式的 ip 地址匹配
提示: IP地址的范围是 0.0.0.0 - 255.255.255.255
r'([0-2][0-5]?[0-5]?).([0-2][0-5]?[0-5]?).([0-2][0-5]?[0-5]?).([0-2][0-5]?[0-5]?)'
- 提取用户输入数据中的数值 (数值包括正负数 还包括整数和小数在内) 并求和
例如:“-3.14good87nice19bye” =====> -3.14 + 87 + 19 = 102.86
import re
str1 = '-3.14good87nice19bye'
result = re.findall(r'-?[1-9]\d*\.*\d*', str1)
sum1 = 0
for x in result:
sum1 += eval(x)
print(sum1)
-
验证输入内容只能是汉字
str1 = input('请输入:') re_str = re.fullmatch(r'[\u4e00-\u9fa5]*', str1) if re_str: print('内容只有汉字') else: print('内容有汉字以外的字符')
-
匹配整数或者小数(包括正数和负数)
result = re.fullmatch(r'-?[0-9]\d*.?\d*', '-0.789') print(result)
-
验证输入用户名和QQ号是否有效并给出对应的提示信息
要求:
用户名必须由字母、数字或下划线构成且长度在6~20个字符之间
QQ号是5~12的数字且首位不能为0username = input('请输入用户名:') name = re.fullmatch(r'\w{6,20}', username) if name: print('用户名正确') else: print('用户名必须由字母、数字或下划线构成且长度在6~20个字符之间') qq = input('请输入QQ:') QQ = re.fullmatch(r'[1-9]\d{4,11}', qq) if QQ: print('QQ号正确') else: print('QQ号是5~12的数字且首位不能为0')
-
拆分长字符串:将一首诗的中的每一句话分别取出来
poem = ‘窗前明月光,疑是地上霜。举头望明月,低头思故乡。’
result = re.split(r'[,。]',poem)