python中的正则表达式

~羽~.

于 2021-07-07 14:52:45 发布

阅读量81

点赞数

分类专栏： Python 文章标签： python 正则表达式

本文链接：https://blog.csdn.net/qq_42702981/article/details/118546690

版权

Python 专栏收录该内容

19 篇文章 2 订阅

订阅专栏

python中的正则表达式

文章目录

python中的正则表达式

什么是正则表达式

处理字符串的方式
可以在字符串中寻找特殊的元素
匹配特定字符串

应用场景：

判读一个字符串是否符合规则
取出指定数据
爬虫岗位较为核心的技术
彩票网站匹配彩票信息。

正则表达式模块——re

正则表达式——匹配字符：

.	匹配除 “\n” 之外的任何单个字符。要匹配包括 ‘\n’ 在内的任何字符，请使用象 ‘[.\n]’ 的模式。
\d	匹配一个数字字符。等价于 [0-9]。
\D	匹配一个非数字字符。等价于 [ ^0-9]。
\s	匹配任何空白字符，包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。
\S	匹配任何非空白字符。等价于 [ ^ \f\n\r\t\v]。
\w	匹配包括下划线的任何单词字符。等价于’[A-Za-z0-9_]’。
\W	匹配任何非单词字符。等价于 ‘[ ^A-Za-z0-9_]’。
\A	匹配字符串的起始
\Z	匹配字符串的结束

正则表达式的量词与组

^	匹配字符串的开头
$	匹配字符串的末尾。
.	匹配任意字符，除了换行符，当re.DOTALL标记被指定时，则可以匹配包括换行符的任意字符。
[…]	用来表示一组字符,单独列出：[amk] 匹配 ‘a’，‘m’或’k’
[^…]	不在[]中的字符：[ ^abc] 匹配除了a,b,c之外的字符。
re*	匹配0个或多个的表达式。
re+	匹配1个或多个的表达式。
re?	匹配0个或1个由前面的正则表达式定义的片段，非贪婪方式
re{ n}	匹配n个前面表达式。例如，"o{2}“不能匹配"Bob"中的"o”，但是能匹配"food"中的两个o。
re{ n,}	精确匹配n个前面表达式。例如，"o{2,}“不能匹配"Bob"中的"o”，但能匹配"foooood"中的所有o。"o{1,}“等价于"o+”。"o{0,}“则等价于"o*”。
re{ n, m}	匹配 n 到 m 次由前面的正则表达式定义的片段，贪婪方式
a\| b	匹配a或b
(re)	匹配括号内的表达式，也表示一个组
(?imx)	正则表达式包含三种可选标志：i, m, 或 x 。只影响括号中的区域。
(?-imx)	正则表达式关闭 i, m, 或 x 可选标志。只影响括号中的区域。
(?: re)	类似 (…), 但是不表示一个组
(?imx: re)	在括号中使用i, m, 或 x 可选标志
(?-imx: re)	在括号中不使用i, m, 或 x 可选标志
(?#…)	注释.
(?= re)	前向肯定界定符。如果所含正则表达式，以 … 表示，在当前位置成功匹配时成功，否则失败。但一旦所含表达式已经尝试，匹配引擎根本没有提高；模式的剩余部分还要尝试界定符的右边。
(?! re)	前向否定界定符。与肯定界定符相反；当所含表达式不能在字符串当前位置匹配时成功。
(?> re)	匹配的独立模式，省去回溯。

贪婪与非贪婪

0次或多次属于贪婪
通过？组合变成非贪婪模式

re模块的函数

findall()

findall(pattern,string)

查找字符串中所有（非重复）出现的正则表达式模式，并返回一个匹配列表
search（）

search（pattern,string)

使用可选标记搜索字符串中第一次出现的正则表达式模式。如果匹配成功，则返回匹配对象；如果失败，则返回None
group（）与groups（）

group（num）返回整个匹配对象，或者编号为num 的特定子组。

groups（）：返回一个包含所有匹配子组的元组（如果没有匹配成功，则返回一个空元组）
split（）

split（pattern，string，max=0）

根据正则表达式的模式分隔符，split函数将字符串分割为列表，然后返回成功匹配的列表，分隔最多操作max次（默认分割所有匹配成功的位置）
match（）

match（pattern,string，flag=0)

尝试使用带有可选的标记的正则表达式的模式来匹配字符串。如果匹配成功，就返回匹配对象；如果失败，就返回None
compile()

compile(pattern,flags=0)

定义一个匹规则的对象。

~羽~.

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python中的正则表达式

python中的正则表达式文章目录python中的正则表达式什么是正则表达式应用场景：正则表达式模块——re正则表达式——匹配字符：正则表达式的量词与组贪婪与非贪婪re模块的函数什么是正则表达式处理字符串的方式可以在字符串中寻找特殊的元素匹配特定字符串应用场景：判读一个字符串是否符合规则取出指定数据爬虫岗位较为核心的技术彩票网站匹配彩票信息。正则表达式模块——re正则表达式——匹配字符：.匹配除 “\n” 之外的任何单个字符。要匹配包括 ‘\n’ 在内的任何字符，
复制链接

扫一扫