Python 正则表达式

最新推荐文章于 2024-10-02 10:53:34 发布

ღCauchyོꦿ࿐

最新推荐文章于 2024-10-02 10:53:34 发布

阅读量84

点赞数 4

分类专栏： Python 文章标签： python 正则表达式

本文链接：https://blog.csdn.net/qq_52678569/article/details/124504936

版权

Python 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

本文详细介绍了Python中的正则表达式，包括常用字符、函数如re.match、re.search、re.sub等的用法，以及正则表达式对象和修饰符。通过实例解析，帮助读者掌握正则表达式在字符串匹配、替换和分隔等方面的应用。

摘要由CSDN通过智能技术生成

文章目录

常用字符

一、元字符

代码	说明
.	匹配除换行符以外的任意字符
\w	匹配字母或数字或下划线或汉字
\s	匹配任意的空白符
\d	匹配数字
\b	匹配单词的开始或结束
^	匹配字符串的开始（在集合字符里[^a]表示非（不匹配）的意思
$	匹配字符串的结束

二、反义字符

代码/语法	说明
\W	匹配任意不是字母，数字，下划线，汉字的字符
\S	匹配任意不是空白符的字符
\D	匹配任意非数字的字符
\B	匹配不是单词开头或结束的位置
[^x]	匹配除了x以外的任意字符
[^aeiou]	匹配除了aeiou这几个字母以外的任意字符

三、限定字符

代码/语法	说明
*	重复零次或更多次
+	重复一次或更多次
?	重复零次或一次
{n}	重复n次
{n,}	重复n次或更多次
{n,m}	重复n到m次

以上参考：这里

常用的正则表达式处理函数

re.match

re.match 尝试从字符串的起始位置匹配一个模式，如果不是起始位置匹配成功的话，match() 就返回 none。

函数语法：

re.match(pattern, string, flags=0)

pattern：匹配的正则表达式。
string：要匹配的字符串。
flags：标志位，用于控制正则表达式的匹配方式。

re.search

re.search 扫描整个字符串并返回第一个成功的匹配。

函数语法：

re.search(pattern, string, flags=0)

pattern：匹配的正则表达式。
string：要匹配的字符串。
flags：标志位，用于控制正则表达式的匹配方式。

re.match与re.search的区别：

re.match只匹配字符串的开始，如果字符串开始不符合正则表达式，则匹配失败，函数返回None；
re.search匹配整个字符串，直到找到一个匹配。

re.sub

Python 的 re 模块提供了re.sub用于替换字符串中的匹配项。

函数语法：

re.sub(pattern, repl, string, count=0, flags=0)

pattern : 正则中的模式字符串。
repl : 替换的字符串，也可为一个函数。
string : 要被查找替换的原始字符串。
count : 模式匹配后替换的最大次数，默认 0 表示替换所有的匹配。

re.compile

compile 函数用于编译正则表达式，生成一个正则表达式（ Pattern ）对象，供 match() 和 search() 这两个函数使用。

函数语法：

re.compile(pattern[, flags])

pattern : 一个字符串形式的正则表达式
flags : 可选，表示匹配模式，比如忽略大小写，多行模式等，具体参数为：

findall

在字符串中找到正则表达式所匹配的所有子串，并返回一个列表，如果有多个匹配模式，则返回元组列表，如果没有找到匹配的，则返回空列表。

注意： match 和 search 是匹配一次 findall 匹配所有。

函数语法：

findall(string[, pos[, endpos]])

string : 待匹配的字符串。
pos : 可选参数，指定字符串的起始位置，默认为 0。
endpos : 可选参数，指定字符串的结束位置，默认为字符串的长度。

re.finditer

和 findall 类似，在字符串中找到正则表达式所匹配的所有子串，并把它们作为一个迭代器返回。

函数语法：

re.finditer(pattern, string, flags=0)

pattern：匹配的正则表达式。
string：要匹配的字符串。
flags：标志位，用于控制正则表达式的匹配方式。

re.split

split 方法按照能够匹配的子串将字符串分割后返回列表。

函数语法：

re.split(pattern, string[, maxsplit=0, flags=0])

pattern：匹配的正则表达式。
string：要匹配的字符串。
maxsplit：分隔次数，maxsplit = 1 分隔一次，默认为 0，不限制次数。
flags：标志位，用于控制正则表达式的匹配方式。

正则表达式对象

re.RegexObject

re.compile() ：返回 RegexObject 对象。

re.MatchObject

group() ：返回被 RE 匹配的字符串。

start() ：返回匹配开始的位置
end()：返回匹配结束的位置
span()：返回一个元组包含匹配 (开始,结束) 的位置

正则表达式修饰符

修饰符	描述
re.I	忽略大小写
re.L	表示特殊字符集 \w, \W, \b, \B, \s, \S 依赖于当前环境
re.M	多行模式
re.S	即为 . 并且包括换行符在内的任意字符（. 不包括换行符）
re.U	表示特殊字符集 \w, \W, \b, \B, \d, \D, \s, \S 依赖于 Unicode 字符属性数据库
re.X	为了增加可读性，忽略空格和 # 后面的注释