Python 正则表达式学习----flags 编译标志位

Python 正则表达式学习—-flags 编译标志位

关于正则表达式更多的内容,推荐https://blog.csdn.net/longerzone/article/details/24303161博客,更推荐书籍《python核心编码》,当然其他叙述正则表达式的书籍都可以,博主此处简介了正则表达式后,主要介绍re模块的flags 编译标志位 re.I、re,S和re.M

1、正则表达式简介

正则表达式(简称为regex)是一些由字符和特殊符号组成的字符串,他们描述了模式的重复或者表述多个字符,于是正则表达式能按照某种模式匹配一些列由相似特征的字符串。正则表达式本身是一种小型的、高度专业化的编程语言,而在python中,通过内嵌集成re模块,程序员可以直接调用来实现正则匹配。正则表达式模式被编译成一系列的字节码,然后由用C编写的匹配引擎执行。

2、正则表达式工作流程

正则表达式工作流程如下图1:
这里写图片描述
首先语言中的正则表达式引擎会将用户使用的正则表达式文本编程成正则表达式对象,然后依次拿出表达式对象和文本中的字符比较,如果每一个字符都能匹配,则匹配成功;一旦有匹配不成功的字符则匹配失败。如果表达式中有量词或边界,将会有相关语法的解决办法,在后期学习中慢慢摸索,都容易理解。

3、正则表达式re模块之flags 编译标志位

Python中flags 编译标志位,用于修改正则表达式的匹配方式,如:是否区分大小写,对多行数据进行匹配等。常用的flags如下:

标志含义
re.S(DOTALL)匹配包括换行在内的所有字符
re.I(IGNORECASE)使匹配对大小写不敏感
re.L(LOCALE)做本地化识别(locale-aware)匹配,法语等
re.M(MULTILINE)多行匹配,影响^和$
re.X(VERBOSE)该标志通过给予更灵活的格式以便将正则表达式写得更易于理解
re.U根据Unicode字符集解析字符,这个标志影响\w,\W,\b,\B

(1)re.I 使匹配对大小写不敏感,如下:

# re.I 的学习,忽略大小写
S1 = 'CoN'   #定义字符串i1
S2 = 'www.xiao.con'    #定义字符串i2
#print(re.search('CoN','www.xiao.con').group())  #区分大小写的子组输出,报有错
print(re.search(S1,S2,re.I).group())  #不区分大小写的子组输出

结果: 输出 con
备注:输出字符的大小以被匹配的字符串的大小写为主,如S2为’www.xiao.CON’,则输出的为:
这里写图片描述

(2)re.M 使用^ 和 $ 符号,实现多行多行匹配。如将所有行的末尾字符串输出得:

# re.M 的学习,将所有行的尾字母或者首部输出
S3 = '''I am girl
        you are boy
        we are friends
        '''                   #定义初始字符串
print(re.findall(r"\w+$",S3,re.M))   #输出S3的每行最后一个字符串

输出为:
这里写图片描述

(3)re.S匹配包括换行在内的所有字符。如下:

s1 = '''jduedhhelloworld:    
        11630
        passgrthgdg
        '''                     #初始字符串,有换行所以用三引号
b = re.findall('hello(.*?)pass',s1)   #findal返回字符串中某个正则表达式模式全部的非重复出现的情况,不包含换行,返回列表
c = re.findall('hello(.*?)pass',s1,re.S)  #包含换行
print('b is',b)  #输出B匹配的结果
print('c is',c)   #输出C,包行匹配输出的结果

结果输出对比为:
这里写图片描述

总结

flags 编译标志位就相当于一些特殊的指令,就如上面提的比如是否忽略大小写。并不是必须使用,不用的时候定义flags=0即可。上面短短三个小代码的学习还涉及了search(),findall() 方法,简单但是重要,博主会在以后的博客中会涉及,当然大家也可以通过推荐的网站书籍进行学习,查阅资料解决遇到的问题,对自己的成长会更有帮助。

源代码:
链接:https://pan.baidu.com/s/1giUdK9PgAcoBskn2sbj4yQ 密码:dxmh

  • 1
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: Python中的re模块提供了一种用于处理正则表达式的工具。其中,compile函数可以将正则表达式编译为一个正则对象,从而提高正则表达式的效率。 compile函数的语法如下: re.compile(pattern, flags=0) 其中,参数pattern代表要编译正则表达式flags代表可选的标志位,用于控制正则表达式的匹配方式。 使用compile函数可以将多次使用的正则表达式进行编译,从而提高程序的效率。在实际开发中,如果需要对一个字符串进行多次匹配操作,建议使用compile函数预编译正则表达式。 例如,假设要匹配所有以字母开头、后跟数字的字符串,可以使用如下代码: ```python import re # 编译正则表达式 pattern = re.compile(r"[a-zA-Z]\d+") # 匹配字符串 result = pattern.findall("A123 B456 C789") print(result) # 输出: ['A123', 'B456', 'C789'] ``` 在上面的代码中,首先使用compile函数编译正则表达式r"[a-zA-Z]\d+",然后使用findall方法匹配字符串"A123 B456 C789",返回了所有符合条件的子串。 总之,compile函数是一个非常有用的正则表达式工具,可以提高正则表达式的效率,减少不必要的匹配操作,从而在实际开发中发挥作用。 ### 回答2: 在Python中,re模块是用于正则表达式操作的标准库。而re中的compile函数是用于将字符串形式的正则表达式编译成一个正则表达式对象,以便在之后的匹配中可以直接使用该对象。 使用compile函数编译正则表达式可以提高匹配效率,特别是在需要重复匹配同一个表达式时。因为每次使用正则表达式匹配都需要重新构建正则表达式的解析树,而使用compile函数编译正则表达式就可以把解析树缓存起来,在需要匹配时可以直接调用缓存的解析树,从而提高了匹配效率。 具体使用方法,可以先使用compile函数将正则表达式编译成一个对象,然后使用该对象的match、search、findall等方法进行匹配操作。例如: import re pattern = re.compile(r'\d+') # 编译正则表达式 result = pattern.findall('hello123world456') # 使用编译后的正则表达式对象进行匹配 print(result) # ['123', '456'] 另外需要注意的是,使用compile函数编译正则表达式对象是可以重复使用的,因此在需要多次匹配同一个表达式时,可以先编译成对象,然后重复调用该对象的方法进行匹配操作,可以避免重复编译的影响。 ### 回答3: 在Python中,re模块可以用来处理正则表达式。compile()函数是re模块的一个方法,它可以将一个正则表达式编译成一个pattern对象,这个对象可以再次被用来处理字符串。 使用re.compile()函数的一个主要原因是它可以提高代码的执行效率。如果需要多次使用同一正则表达式,如果每次都要编译一遍,就会浪费很多时间。如果编译一次之后,将pattern对象保存在一个变量中,就可以在需要时多次使用,提高了程序的运行速度。 compile()函数有两个参数:pattern和flags。其中,pattern表示要编译正则表达式字符串,flags是一个可选的参数,用来指定正则表达式的匹配模式。flags可以是一组位标志,也可以是具体的某个标志。 注意,使用re.compile()创建的pattern对象只支持基本的正则表达式语法。如果需要使用进阶的语法,比如lookahead或lookbehind,就必须使用re模块中的其他函数。 下面是一个使用compile()函数的简单示例: import re pattern = re.compile(r'\d+') # 匹配所有数字 text = 'there are 123 apples' match = pattern.search(text) if match: print(match.group()) # 输出 123 上面的代码首先用compile()函数创建了一个正则表达式对象,表示匹配所有数字。然后它在文本中搜索这个对象,如果匹配成功,就通过group()方法输出匹配的文本。 总之,compile()函数是Python正则表达式的重要组成部分。它可以将需要多次使用的正则表达式对象编译成pattern对象,从而提高程序的效率。使用compile()函数还可以更方便地管理正则表达式,使得代码更加易读易维护。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值