全面掌握 Python 中正则表达式的使用

最新推荐文章于 2024-07-10 09:15:55 发布

置顶

我行于野

最新推荐文章于 2024-07-10 09:15:55 发布

阅读量1.7k

点赞数

文章标签： python 正则表达式

本文链接：https://blog.csdn.net/weixin_45080696/article/details/105388893

版权

本文详述Python re模块，涵盖9个常量、12个函数及正则对象Pattern的使用，通过实例解析常量作用，如IGNORECASE、ASCII等，并探讨何时使用正则对象提高效率。

摘要由CSDN通过智能技术生成

文章目录

re模块主要定义了9个常量、12个函数、1个异常，每个常量和函数都会通过实际代码案例讲解，让大家能更直观的了解其作用！
注：为避免出现代码格式错乱，尽量使用代码截图演示哦。

一、re模块简介

聊到Python正则表达式的支持，首先肯定会想到re库，这是一个Python处理文本的标准库。
标准库的意思表示这是一个Python内置模块，不需要额外下载，目前Python内置模块大概有300个。可以在这里查看Python所有的内置模块：https://docs.python.org/3/py-modindex.html#cap-r

因为re是内置模块，所以不需要再下载，使用时直接引入即可：
import re

re模块官方文档：https://docs.python.org/zh-cn/3.8/library/re.html
re模块库源码：https://github.com/python/cpython/blob/3.8/Lib/re.py

二、re模块常量

常量即表示不可更改的变量，一般用于做标记。
re模块中有9个常量，常量的值都是int类型！
在这里插入图片描述
上图我们可以看到，所有的常量都是在RegexFlag枚举类来实现，这是在Python 3.6做的改版。在Python 3.6以前版本是直接将常量写在re.py中，使用枚举的好处就是方便管理和使用！

下面我们来快速学习这些常量的作用及如何使用他们，按常用度排序！

1. IGNORECASE

语法： re.IGNORECASE 或简写为 re.I
作用：进行忽略大小写匹配。
代码案例：
在这里插入图片描述
在默认匹配模式下大写字母B无法匹配小写字母b，而在忽略大小写模式下是可以的。

2. ASCII

语法： re.ASCII 或简写为 re.A
作用：顾名思义，ASCII表示ASCII码的意思，让 \w, \W, \b, \B, \d, \D, \s 和 \S 只匹配ASCII，而不是Unicode。
代码案例：
在这里插入图片描述
在默认匹配模式下\w+匹配到了所有字符串，而在ASCII模式下，只匹配到了a、b、c（ASCII编码支持的字符）。
注意：这只对字符串匹配模式有效，对字节匹配模式无效。

3. DOTALL

语法： re.DOTALL 或简写为 re.S
作用： DOT表示.，ALL表示所有，连起来就是.匹配所有，包括换行符\n。默认模式下.是不能匹配行符\n的。
代码案例：
在这里插入图片描述
在默认匹配模式下.并没有匹配换行符\n，而是将字符串分开匹配；而在re.DOTALL模式下，换行符\n与字符串一起被匹配到。
注意：默认匹配模式下.并不会匹配换行符\n。

4. MULTILINE

语法： re.MULTILINE 或简写为 re.M
作用：多行模式，当某字符串中有换行符\n，默认模式下是不支持换行符特性的，比如：行开头和行结尾，而多行模式下是支持匹配行开头的。
代码案例：
在这里插入图片描述
正则表达式中^表示匹配行的开头，默认模式下它只能匹配字符串的开头；而在多行模式下，它还可以匹配换行符\n后面的字符。
注意：正则语法中^匹配行开头、\A匹配

最低0.47元/天解锁文章

我行于野

关注

0
点赞
踩
14

收藏

觉得还不错? 一键收藏
2
评论
全面掌握 Python 中正则表达式的使用

文章目录一、re模块简介二、re模块常量1. IGNORECASE2. ASCII3. DOTALL4. MULTILINE5. VERBOSE6.LOCALE7.UNICODE8. DEBUG9.TEMPLATE10. 常量总结三、re模块函数1.查找一个匹配项2.查找多个匹配项3.分割4.替换5.编译正则对象6.其他四、re模块异常五、正则对象Pattern1. 与re模块函数一致2. 官...
复制链接

扫一扫