python正则表达式基础及相关函数

1.正则表达式
正则表达式其实就是一个字符串,使用这个字符串来进行描述某个语法规则搜索的模式

import re

re.findall(pattren,string)

参数一:正则表达式

参数二:被正则的表达式

功能:对string进行正则匹配,将匹配的结果作为列表返回

2.匹配单个字符
. 匹配除换行符以外的任意字符

[] 字符集合,表示匹配[]中任意一个字符

[0 -9] 表示匹配任意的数字

[a - z] 表示匹配所有的小写字母

[A - Z]表示匹配所有的大写字母

[0-9a-zA-Z_]匹配数字字母下划线

[^0-9] ^在[]括号中表示脱字节,非数字(不匹配数字)

\d 匹配数字,效果同[0-9]

\D 匹配非数字,效果同[ ^ 0-9]

\w 匹配数字字母下划线,效果同[0-9a-zA-Z_]

\W 匹配非数字字母下划线,效果同[ ^ 0-9a-zA-Z_]

\s 表示匹配空白符效果同[\n\r\f\t]

\S匹配非空白符效果同[ ^ \n\r\f\t]

3.边界匹配
^ 行首匹配,从每一行的开始进行匹配
$ 行尾匹配,匹配每一行的结束
\A 匹配字符串的开始,与^的区别是,即使在re.M的模式下,也不会匹配其他的行
\Z 匹配字符串的结束,与$的区别是,即使在re.M的模式下,也不会匹配其他的行尾
\b 匹配单词的边界 \b写在左边匹配左边界,右边右边界
\B 匹配单词的非边界 \B写在左边,左边界不匹配,右边右边不匹配。

4.匹配多个字符
(xyz) 将小括号里面的内容作为一个整体来进行匹配
x? 匹配0个或者1个x 尽可能少的匹配
x* 匹配0个或者多个x 贪婪匹配,尽肯能多的匹配
x+ 匹配至少一个,贪婪匹配,尽可能多的匹配
x{n} 匹配确定的n个x
x{n,} 匹配至少n个x 贪婪匹配
x{n,m} 匹配至少n个,最多m个x
x|y 标识或
.*? 经常一起连用, . 代表任意字符 * 代表尽可能多的匹配 ? 贪婪匹配的限制

5.正则表达式常用函数
re.compile(pattern,flags)
参数一:正则表达式
参数二:标志位
功能:将正则表达式编译成一个正则对象然后返回。调用的时候调用正则对象即可。

re.match(pattern,string,flags)
参数一:正则表达式
参数二:string
参数三:标志位
功能:对string从字符串开始进行匹配,若匹配的上则返回匹配成功的对象,若匹配不上则返回None
注意:这并不是一个完全匹配,若匹配成功之后, string有剩余仍然匹配成功,若要完全匹配,可以在正则的末尾添加$即可

re.search(pattern,string,flags)
参数一:正则表达式
参数二:字符串
参数三:标志位
功能:以指定的正则格式在 string进行查找若找到则直接返回第一匹配成功的对象,不再继续匹配。若找不到返回None

re.findall(pattern,string,flags)
功能:以指定的正则表达式去 string中进行匹配,把所有匹配的结果作为list返回。若没匹配上返回空列表

re.finditer(pattern,string,flags)
功能:以指定的正则表达式去 string中进行匹配,把所有匹配的结果作为迭代器返回。

re.split(pattern,string,maxsplit,flags)
功能:以指定的正则对 string进行切片,并且将切片后的结果作为列表返回。maxsplit最大切割次数,不指定全部切割

re.sub(pattern,repl,string,count)
功能:将匹配到的字符串,以repl进行替换,并且返回替换后的结果
count:指定替换次数,若不指定则默认

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: Python中的re模块提供了一种用于处理正则表达式的工具。其中,compile函数可以将正则表达式编译为一个正则对象,从而提高正则表达式的效率。 compile函数的语法如下: re.compile(pattern, flags=0) 其中,参数pattern代表要编译的正则表达式,flags代表可选的标志位,用于控制正则表达式的匹配方式。 使用compile函数可以将多次使用的正则表达式进行编译,从而提高程序的效率。在实际开发中,如果需要对一个字符串进行多次匹配操作,建议使用compile函数预编译正则表达式。 例如,假设要匹配所有以字母开头、后跟数字的字符串,可以使用如下代码: ```python import re # 编译正则表达式 pattern = re.compile(r"[a-zA-Z]\d+") # 匹配字符串 result = pattern.findall("A123 B456 C789") print(result) # 输出: ['A123', 'B456', 'C789'] ``` 在上面的代码中,首先使用compile函数编译了正则表达式r"[a-zA-Z]\d+",然后使用findall方法匹配字符串"A123 B456 C789",返回了所有符合条件的子串。 总之,compile函数是一个非常有用的正则表达式工具,可以提高正则表达式的效率,减少不必要的匹配操作,从而在实际开发中发挥作用。 ### 回答2: 在Python中,re模块是用于正则表达式操作的标准库。而re中的compile函数是用于将字符串形式的正则表达式编译成一个正则表达式对象,以便在之后的匹配中可以直接使用该对象。 使用compile函数编译正则表达式可以提高匹配效率,特别是在需要重复匹配同一个表达式时。因为每次使用正则表达式匹配都需要重新构建正则表达式的解析树,而使用compile函数编译正则表达式就可以把解析树缓存起来,在需要匹配时可以直接调用缓存的解析树,从而提高了匹配效率。 具体使用方法,可以先使用compile函数正则表达式编译成一个对象,然后使用该对象的match、search、findall等方法进行匹配操作。例如: import re pattern = re.compile(r'\d+') # 编译正则表达式 result = pattern.findall('hello123world456') # 使用编译后的正则表达式对象进行匹配 print(result) # ['123', '456'] 另外需要注意的是,使用compile函数编译的正则表达式对象是可以重复使用的,因此在需要多次匹配同一个表达式时,可以先编译成对象,然后重复调用该对象的方法进行匹配操作,可以避免重复编译的影响。 ### 回答3: 在Python中,re模块可以用来处理正则表达式。compile()函数是re模块的一个方法,它可以将一个正则表达式串编译成一个pattern对象,这个对象可以再次被用来处理字符串。 使用re.compile()函数的一个主要原因是它可以提高代码的执行效率。如果需要多次使用同一正则表达式,如果每次都要编译一遍,就会浪费很多时间。如果编译一次之后,将pattern对象保存在一个变量中,就可以在需要时多次使用,提高了程序的运行速度。 compile()函数有两个参数:pattern和flags。其中,pattern表示要编译的正则表达式字符串,flags是一个可选的参数,用来指定正则表达式的匹配模式。flags可以是一组位标志,也可以是具体的某个标志。 注意,使用re.compile()创建的pattern对象只支持基本的正则表达式语法。如果需要使用进阶的语法,比如lookahead或lookbehind,就必须使用re模块中的其他函数。 下面是一个使用compile()函数的简单示例: import re pattern = re.compile(r'\d+') # 匹配所有数字 text = 'there are 123 apples' match = pattern.search(text) if match: print(match.group()) # 输出 123 上面的代码首先用compile()函数创建了一个正则表达式对象,表示匹配所有数字。然后它在文本中搜索这个对象,如果匹配成功,就通过group()方法输出匹配的文本。 总之,compile()函数Python正则表达式的重要组成部分。它可以将需要多次使用的正则表达式对象编译成pattern对象,从而提高程序的效率。使用compile()函数还可以更方便地管理正则表达式,使得代码更加易读易维护。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值