正则表达式笔记

最新推荐文章于 2022-05-13 23:28:53 发布

crystal_da

最新推荐文章于 2022-05-13 23:28:53 发布

阅读量247

点赞数

分类专栏： python笔记

python笔记专栏收录该内容

4 篇文章 0 订阅

订阅专栏

1、非捕获组(non-capturing)

关于捕获的一些主要用法

(?:X)

(?=X)

(?<=X)

(?!X)

(?<!X)

小括号里包裹指定字表达式（子串），这就是分组。

使用小括号指定一个子表达式后，匹配这个子表达式的文本（即匹配的内容）可以在表达式或者其他过程中接着用，默认情况下，每个分组（小括号）会自动拥有一个组号,从左到右，以分组的左括号为标志，第一个出现的分组组号为1，后续递增。

例如：

“aabcd”

采用正则 (a(b))(c) match 结果入下：

分组	捕获
$1(group1)	ab
$2(group2)	b
$3(group3)	c

一、(?:)非捕获组

(\d+)(?:\.?)(?:\d+)([￥$])$

二、(?=)和(?<=) 前后查找

[0-9a-z]{2}(?=aa) var str = "12332aa438aaf";

Match List:

1	32
2	38

这个正则的意思是：匹配这么一个字符串，它要满足：是两位字符（数字，或字母），且后面紧跟着两个a。

2、 (?<=)

(?<=aa)[0-9a-z]{2};

字符串还是str = "12332aa438aaf";

它的输出：43。

三、(?!)和(?<!)

[0-9a-z]{2}(?!aa)意思是：匹配两个字符，且后面紧跟着的不是aa

(?<!aa)[0-9a-z]{2} 意思是：匹配两个字符，且前面紧跟着的不是aa

2、模式修饰符

(?i)即匹配时不区分大小写。表示匹配时不区分大小写。

(?s)即Singleline(单行模式)。表示更改.的含义，使它与每一个字符匹配（包括换行符\n）。

(?m)即Multiline(多行模式) 。表示更改^和$的含义，使它们分别在任意一行的行首和行尾匹配，而不仅仅在整个字符串的开头和结尾匹配。(在此模式下,$的精确含意是:匹配\n之前的位置以及字符串结束前的位置.)

举例：(?m)(\/\w+\/)

(?x)：表示如果加上该修饰符，表达式中的空白字符将会被忽略，除非它已经被转义。

(?A)：表示如果使用这个修饰符，那么表达式必须是匹配的字符串中的开头部分。比如说"/a/A"匹配"abcd"。

(?E)：与"m"相反，表示如果使用这个修饰符，那么"$"将匹配绝对字符串的结尾，而不是换行符前面，默认就打开了这个模式。

3、边界符

^ 和 $ 分别代表一行（line）的开始和结束的位置；\A 和 \z 分别代表输入（input）的开始和结束位置；

Line & Input （行和输入的区别）:

行是以终止子作为标志结束的字符串片段，输入是整一段字符串。例如 "Ggicci is a good guy.\nGgicci's real name is OOXX."，这段字符串就是一个输入，其中 "Ggicci is a good guy." 就是一个行。

crystal_da

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
正则表达式笔记

1、非捕获组(non-capturing)关于捕获的一些主要用法(?:X)(?=X)(?&lt;=X)(?!X)(?&lt;!X)小括号里包裹指定字表达式（子串），这就是分组。使用小括号指定一个子表达式后，匹配这个子表达式的文本（即匹配的内容）可以在表达式或者其他过程中接着用，默认情况下，每个分组（小括号）会自动拥有一个组号,从左到右，以分组的左括号为标志，第一个出...
复制链接

扫一扫