正则表达式

正则表达式

  1. re模块

    python提供专门用来支持正则表达式的一个模块
    
  2. 正则语法 - 是让字符串复杂问题变得简单的工具

    """
    python正则表达式:r'正则表达式'
    
    匹配字符 
    . 	  -	   匹配任意一个字符
    \d    -    匹配一个数字  
    \s    -    匹配任意一个空白字符  空格、回车\n、制表符\t
    \D	  -    匹配任意一个非数字
    \S    -    匹配任意一个非空白字符
    \w    -    匹配任意一个字母、数字或下划线
    [字符集]  - 匹配字符集中的任意一个字符 [a-z] [\babc]
    [^字符集]  -  匹配不在字符集中的任意一个字符
    """
    
  3. 检测类符号

    """
    检测类符号的存在不影响被匹配的字符串长度,它的作用是在匹配成功的前提下检测符号所有在的位置符合要求
    检测类符号的用法: 先去掉检测类符号,看是否能匹配成功,如果失败整个正则匹配失败,如果成功再看检测符号所在的位置是否符合要求
    
    \b -  检测是否是单词边界
    单词边界  - 能够区分两个不同单词的符号都是单词边界,例如: 空白 标点符号 字符串开头字符串结尾
    \B  -  检测是否是非单词边界
    
    ^   - 检测是否是字符串开头
    
    $  -  检测是否是字符串结尾
    

    “”"

    
    
  4. 匹配次数

    """
    *  -  匹配0次或者多次(任意次数)
    +  -  匹配1次或者多次(至少一次)
    ?  -  匹配0次或1次
    {N} - 匹配N次
    {M,N} 匹配M到N次
    {,N}   -  匹配最多N次
    {M,}   -  匹配至少M次
    
    # 注意 匹配次数对应的符号前面必须是匹配类符号
    
    """
    
    
  5. 分组和分支

    """
    ()  -  分组
    作用1:将()中的内容作为一个整体,进行整体相关操作,例如:整体控制次数
    作用2:通过'\M' 重复前面第M个分组匹配到的结果,M从1开始
    作用3:捕获(findall)
    
    |  - 分支
    正则1|正则2  -  先用正则1进行匹配如果直接,如果成功就直接匹配成功,如果失败再用正则2进行匹配
    
    3. 转义符号
    在特殊符号前加\,让符号的功能消失,变成一个普通符号
    独立存在有特殊功能的符号,将符号放入[]中其功能也会自动消失
    
    """
    
  6. re模块

    """
    fuiimatch()
    macth()
    search()
    findall()
    finiter()
    split()
    sub()
    
    flags参数
    # 上面的每一个函数都有一个参数flags,用来设置正则参数
    # 1) 单行匹配和多行匹配参数:re.S/ re.M(默认的)
    # 单行匹配:.可以匹配\n
    # 多行匹配:.不能和\n匹配
    
    # flags=re.S == r'(?s)正则表达式'
    # flags=re.S|re.I == r'(?is)正则表达式'
    
    # 2) 忽略大小写:re.I
    
    """
    

利用正则表达式完成下面的操作:

一、不定项选择题
  1. 能够完全匹配字符串"(010)-62661617"和字符串"01062661617"的正则表达式包括(A )

A.r"\(?\d{3}\)?-?\d{8}"
B. r"[0-9()-]+"
C.r"[0-9(-)]*\d*"
D.r"[(]?\d*[)-]*\d*"

  1. 能够完全匹配字符串“back”和“back-end”的正则表达式包括( B)
    A. r“\w{4}-\w{3}|\w{4}”
    B. r“\w{4}|\w{4}-\w{3}”
    C.r “\S±\S+|\S+”
    D. r“\w*\b-\b\w*|\w*”

  2. 能够完全匹配字符串“go go”和“kitty kitty”,但不能完全匹配“go kitty”的正则表达式包括(A)
    A.r “\b(\w+)\b\s+\1\b”
    B. r“\w{2,5}\s*\1”
    C. r“(\S+) \s+\1”
    D. r“(\S{2,5})\s{1,}\1”

  3. 能够在字符串中匹配“aab”,而不能匹配“aaab”和“aaaab”的正则表达式包括(B )
    A. r“a*?b”
    B. r“a{,2}b”
    C. r“aa??b”
    D. r“aaa??b”

二、编程题

1.用户名匹配

​ 要求: 1.用户名只能包含数字 字母 下划线

​ 2.不能以数字开头

​ 3.⻓度在 6 到 16 位范围内

r'[a-zA-Z_]\w{5,15}'
  1. 密码匹配

​ 要求: 1.不能包含!@#¥%^&*这些特殊符号

​ 2.必须以字母开头

​ 3.⻓度在 6 到 12 位范围内

result = re.fullmatch(r'[a-zA-Z][^!@#¥%^&*]{5,11}','a12ddc9')
  1. ipv4 格式的 ip 地址匹配
    提示: IP地址的范围是 0.0.0.0 - 255.255.255.255
r'([0-2][0-5]?[0-5]?).([0-2][0-5]?[0-5]?).([0-2][0-5]?[0-5]?).([0-2][0-5]?[0-5]?)'
  1. 提取用户输入数据中的数值 (数值包括正负数 还包括整数和小数在内) 并求和
例如:“-3.14good87nice19bye” =====> -3.14 + 87 + 19 = 102.86
import re

str1 = '-3.14good87nice19bye'
result = re.findall(r'-?[1-9]\d*\.*\d*', str1)
sum1 = 0
for x in result:
    sum1 += eval(x)
print(sum1)
  1. 验证输入内容只能是汉字

    str1 = input('请输入:')
    re_str = re.fullmatch(r'[\u4e00-\u9fa5]*', str1)
    if re_str:
        print('内容只有汉字')
    else:
        print('内容有汉字以外的字符')
    	
    
  2. 匹配整数或者小数(包括正数和负数)

    result = re.fullmatch(r'-?[0-9]\d*.?\d*', '-0.789')
    print(result)
    
  3. 验证输入用户名和QQ号是否有效并给出对应的提示信息

    要求:
    用户名必须由字母、数字或下划线构成且长度在6~20个字符之间
    QQ号是5~12的数字且首位不能为0

    username = input('请输入用户名:')
    name = re.fullmatch(r'\w{6,20}', username)
    if name:
    	print('用户名正确')
    else:
        print('用户名必须由字母、数字或下划线构成且长度在6~20个字符之间')
        
    qq = input('请输入QQ:')
    QQ = re.fullmatch(r'[1-9]\d{4,11}', qq)
    if QQ:
        print('QQ号正确')
    else:
        print('QQ号是5~12的数字且首位不能为0')
    
  4. 拆分长字符串:将一首诗的中的每一句话分别取出来

    ​ poem = ‘窗前明月光,疑是地上霜。举头望明月,低头思故乡。’

    result = re.split(r'[,。]',poem)
    
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值