还没搞懂正则？熬夜到虚脱整理出来的Python的正则表达式总结（Regular Expression）

最新推荐文章于 2024-05-27 23:18:45 发布

web17886480312

最新推荐文章于 2024-05-27 23:18:45 发布

阅读量77

点赞数

分类专栏：前端 html 文章标签：正则表达式 python perl

本文链接：https://blog.csdn.net/web17886480312/article/details/123399019

版权

前端同时被 2 个专栏收录

42 篇文章 2 订阅

订阅专栏

html

42 篇文章 0 订阅

订阅专栏

前言：

作者：神的孩子在歌唱
这是我听老师讲课做的笔记
大家好，我叫陈运智，大家可以叫我智

正则表达式

一. python正则表达式介绍

正则表达式是一个特殊的字符序列，它能帮助你方便的检查一个字符串是否与某种模式匹配。
Python 自1.5版本起增加了re 模块，它提供 Perl 风格的正则表达式模式。
re 模块使 Python 语言拥有全部的正则表达式功能。
compile 函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象。该对象拥有一系列方法用于正则表达式匹配和替换。
re 模块也提供了与这些方法功能完全一致的函数，这些函数使用一个模式字符串做为它们的第一个参数。

二. re模块

2.1 match方法

re.match 尝试从字符串的起始位置匹配一个规则，匹配成功就返回match对象，否则返回None。可以使用group()获取匹配成功的字符串。

语法：re.match(pattern, string, flags=0)
参数说明：

pattern

匹配的正则表达式

string

要匹配的字符串。

flags

标志位，用于控制正则表达式的匹配方式，如：是否区分大小写，多行匹配等等。

我们可以使用group(num) 或 groups() 匹配对象函数来获取匹配表达式。

group(num=0)

匹配的整个表达式的字符串，group() 可以一次输入多个组号，在这种情况下它将返回一个包含那些组所对应值的元组。

groups()

返回一个包含所有小组字符串的元组，从 1 到所含的小组号。

代码演示

‘’’
修饰符描述
re.I 使匹配对大小写不敏感
re.L 做本地化识别（locale-aware）匹配
re.M 多行匹配，影响 ^ 和 $
re.S 使 . 匹配包括换行在内的所有字符
re.U 根据Unicode字符集解析字符。这个标志影响 w, W, , B.
re.X 该标志通过给予你更灵活的格式以便你将正则表达式写得更易于理解。
‘’’

在这里插入图片描述

输出：
在这里插入图片描述

2.2 匹配规则

2.2.1 匹配字符

符号

匹配规则

.（点）

匹配任意1个字符除了换行符

[abc ]

匹配abc中的任意一个字符

匹配一个数字，即0-9

匹配非数字，即不是数字

匹配空白，即空格，tab键

匹配非空白，除空格，tab键之类的

匹配单词字符，即a-z、A-Z、0-9、_

匹配非单词字符

.点的使用,匹配除了换行符之外的任意一个字符字符，还可以.*输出后面的字符串

import re
data=‘python’
parrtern=’…’#匹配规则，这里匹配两个字符
res=re.match(parrtern,data)
print(res.group())#输出：py
‘’‘测试二’’’
names=‘运智在学习python’,‘运气’,‘换人’
pattern=‘运.’#匹配规则：会匹配运开头的
for item in names:
chen=re.match(pattern,item)
if chen:
print(chen.group())#输出运智，运气

输出：
在这里插入图片描述
2. [] 中括号：匹配中括号中的任意一个字符，

str1='hello'
res=re.match('[he]',str1)
print(res.group())#输出：h

2.2.2 分组匹配

符号

匹配规则

匹配左右任意一个表达式

(ab)

将括号中字符作为一个分组

引用分组num匹配到的字符串

分组起别名

(P=name)

引用别名为name分组匹配到的字符串

代码按例：

在这里插入图片描述

2.2.3 限定匹配字符规则

原理:就是匹配数量

符号

匹配规则

匹配前一个字符出现0次或者无限次，即可有可无

匹配前一个字符出现1次或者无限次，即至少有1次

匹配前一个字符出现1次或者0次，即要么有1次，要么没有

{m}

匹配前一个字符出现m次

{m,}

匹配前一个字符至少出现m次

{n,m}

匹配前一个字符出现从n到m次

* 匹配前一个字符出现0次或者无限次，即可有可无
代码：

res=re.match(’[A-Z]’,‘Cy’)#匹配0次
print(res.group())#C
res=re.match(’[A-Z][a-z]’,‘Che’)#也可以写成" [A-Za-z]* "
print(res.group())

re.match(’[a-zA-Z]+[w]*’,‘na99m_e’)

#re.match(‘d{4}’,‘1234’)#精确匹配

输出：

在这里插入图片描述
2. 代码按例匹配邮箱

regexMail=re.match('[a-zA-Z0-9]{6,11}@qq.com','chenyunzhi@qq.com')
if regexMail:
    print('匹配成功{}'.format(regexMail.group()))
    pass

输出：
在这里插入图片描述

2.2.4 转义字符

符号

匹配规则

匹配字符串开头

匹配字符串结尾

import re
# 在正则前加r，表示原生字符串，python字符串不转义 或者直接\\a。
print(re.match(r'c:\a.txt','c:\a.txt').group())#c:a.txt

dt='python is chen'
result=re.match('^p.*',dt)#开头是对的就输出
chen=re.match('^pw{5}',dt)
End=re.match('w{5,12}@[w]{1,9}.w{3}$','chenyunzhi@qq.com')
if result:
    print(result.group())#python is chen
    print(chen.group())#python
    print(End.group())#chenyunzhi@qq.com

输出：
在这里插入图片描述

三. re中的编译函数

3.1 compile方法

compile 可以把一个字符串编译成字节码
优点：在使用正则表达式进行match的操作时，python会将字符串转为正则表达式对象，
而如果使用compile只需要一次转换，以后再使用模式对象的话 无需转换

import re
rs=re.compile(‘w.*’)
res=rs.match(‘chenyunzhi’)
print(res.group())#输出：chenyunzhi

3.2 search方法

search ：在全文中匹配一次，匹配到就返回
语法：re.search(pattern, string, flags=0)

参数

描述

pattern

匹配的正则表达式

string

要匹配的字符串。

flags

标志位，用于控制正则表达式的匹配方式，如：是否区分大小写，多行匹配等等。

代码

‘’’
print(re.search(‘python’,‘人生苦短，我用python’).group())
#输出：python

3.3 finall方法

finall（）：查询字符串中某个正则表达式全部的非重复出现的情况返回是一个符合正则表达式的结果列表
语法：findall(string[, pos[, endpos]])

参数

描述

string

待匹配的字符串。

pos

可选参数，指定字符串的起始位置，默认为 0。

endpos

可选参数，指定字符串的结束位置，默认为字符串的长度。

3.代码

print(re.findall('p','python的开头是p'))#输出：['p', 'p']

小结：search找到就返回，finall全部找到才返回

3.4 sub方法

sub：将匹配到的数据进行替换,实现目标的搜索和查找
语法：sub(pattern, repl, string, count=0, flags=0)

参数

描述

pattern

正则中的模式字符串。

repl

替换的字符串，也可为一个函数。

string

要被查找替换的原始字符串。

count

模式匹配后替换的最大次数，默认 0 表示替换所有的匹配。

flags

标志位，用于控制正则表达式的匹配方式

代码

在这里插入图片描述

输出：
在这里插入图片描述

3.5 split方法

split：实现分割字符串,以列表形式返回
语法：split(pattern, string, maxsplit=0, flags=0)

参数

描述

pattern

匹配的正则表达式

string

要匹配的字符串。

maxsplit

分隔次数，maxsplit=1 分隔一次，默认为 0，不限制次数。

flags

标志位，用于控制正则表达式的匹配方式

print(re.split(',','chen,yun,zhi'))#输出：['chen', 'yun', 'zhi']

四. 贪婪模式与非贪婪模式

默认条件下为贪婪模式

贪婪：在满足条件情况下尽可能匹配到数据
非贪婪：满足条件就可以，在"*","?","+","{m,n}"后面加上？，就能将贪婪变成非贪婪.

代码

#贪婪模式
pattern=re.compile('a.*b')
result=pattern.search('abcabcd')
print(result.group())#abcab

#非贪婪
pattern=re.compile('a.*?b')
result=pattern.search('abcabcd')
print(result.group())#ab

输出：

abcab
ab

上面可以看出，贪婪模式要匹配到最后一个b才停止，然而非贪婪模式匹配到第一个b就停止了

本人博客：https://blog.csdn.net/weixin_46654114
转载说明：跟我说明，务必注明来源，附带本人博客连接。

请给我点个赞鼓励我吧
在这里插入图片描述

web17886480312

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
还没搞懂正则？熬夜到虚脱整理出来的Python的正则表达式总结（Regular Expression）

前言：作者：神的孩子在歌唱这是我听老师讲课做的笔记大家好，我叫陈运智，大家可以叫我智正则表达式一. python正则表达式介绍二. re模块2.1 match方法2.2 匹配规则2.2.1 匹配字符2.2.2 分组匹配2.2.3 限定匹配字符规则2.2.4 转义字符三. re中的编译函数3.1 compile方法3.2 search方法3.3 finall方法3.4 sub方法3.5 split方法四. 贪婪模式与非贪婪模式一.
复制链接

扫一扫