正则表达式

顺心而行...

已于 2023-01-16 17:46:03 修改

阅读量126

点赞数

分类专栏：学习随记文章标签：正则表达式学习 Powered by 金山文档

于 2023-01-16 16:54:43 首次发布

本文链接：https://blog.csdn.net/weixin_41652574/article/details/128706224

版权

学习随记专栏收录该内容

8 篇文章 1 订阅

订阅专栏

1. 概念：

使用单个字符串来描述、匹配一系列符合某个句法规则的字符串

2. 工具：

RegexBuddy：http://www.regexbuddy.com/

RegExBuilder：http://www.redfernplace.com/software-projects/regex-builder/

在线测试工具：http://too/.chinaz.com/regex/

3. 元字符

*（匹配任意个字符）、?（匹配单个字符）、\（转义）、分支条件： | （类似“或”）

元字符	说明
.	匹配除换行符以外的任意字符
\w	匹配字母或数字或下划线或汉字
\s	匹配任意的空白符
\d	匹配数字
\b	匹配单词的开始或结束
^	匹配字符串的开始
$	匹配字符串的结束

反义：

元字符	说明
\W	匹配任意不是字母，数字，下划线，汉字的字符
\S	匹配任意不是空白符的字符
\D	匹配任意非数字的字符
\B	匹配不是单词开始或结束的位置
[^X]	匹配除了x以外的任意字符
[^aeiou]	匹配除了aeiou这几个字母以外的任意字符

4. 注释

启用”忽略模式里的空白符“选项

（?<= # 断言要匹配的文本的前缀

<(\w+)> # 查找尖括号括起来的字母或数字（即HTML/XML标签）

） # 前缀结束

.* # 匹配任意文本

（?= # 断言要匹配的文本的后缀

<\/\1> # 查找尖括号括起来的内容：前面是一个”/”，后面是先前捕获的标签

） # 后缀结束

5. 重复

语法	说明
*	重复零次或更多次
+	重复一次或更多次
？	重复零次或一次
{n}	重复n次
{n,}	重复n次或更多次
{n,m}	重复n次到m次

6. 分组

将子表达式进行做成子集

使用（）进行分组，方便对match的字符串进行划分

(\d{1,3}\.){3}\d{1,3}

分组的命名：

（?<groupname>exp)

（?：exp) # 匹配exp,不捕获匹配的文本，也不给此分组分配组号

7. 贪婪与懒惰

贪婪（尽可能多）：

a.*b (aabab) -> aabab

懒惰（尽可能少）：

匹配任意数量的重复，但是在能使整个匹配成功的前提下使用最少的重复

a.*?b (aabab) -> aab

语法	说明
*?	重复任意次，但尽可能少重复
+？	重复一次或更多次，但尽可能少重复
？？	重复零次或一次，但尽可能少重复
{n,m}？	重复n到m次，但尽可能少重复
{n,}？	重复n次以上，但尽可能少重复

8. 处理选项

语法	说明
IgnoreCase	匹配时不区分大小写
Multiline	更改^和$的含义，使它们分别在任意一行的行首和行尾匹配，而不仅仅在整个字符串的开头和结尾匹配。（在此模式下，$的精确含意是：匹配\n之前的位置以及字符串结束前的位置.）
Singleline	更改.的含义，使它与每一个字符匹配（包括换行符\n）
IgnorePatternWhitespace	忽略表达式中的非转义空白并启用由#标记的注释
ExplicitCapture	仅捕获已被显式命名的组