正则基本知识

最新推荐文章于 2024-09-06 08:18:25 发布

thoughtfly

最新推荐文章于 2024-09-06 08:18:25 发布

阅读量83

点赞数

分类专栏：正则表达式文章标签：正则表达式 C C++ C# F#

本文链接：https://blog.csdn.net/thoughtfly/article/details/83522967

版权

正则表达式专栏收录该内容

10 篇文章 0 订阅

订阅专栏

表达式的构造

正则表达式中/i,/g,/ig,/gi,/m的区别和含义

/i (忽略大小写)

/g (全文查找出现的所有匹配字符)

/m (多行查找)

/gi(全文查找、忽略大小写)

/ig(全文查找、忽略大小写)

\t	制表符 ('\u0009')
\n	新行（换行）符 ('\u000A')
\r	回车符 ('\u000D')
\f	换页符 ('\u000C')
\a	报警 (bell) 符 ('\u0007')
\e	转义符 ('\u001B')

字符类
[abc]	a、b 或 c（简单类）
[^abc]	任何字符，除了 a、b 或 c（否定）
[a-zA-Z]	a 到 z 或 A 到 Z，两头的字母包括在内（范围）
[a-d[m-p]]	a 到 d 或 m 到 p：[a-dm-p]（并集）
[a-z&&[def]]	d、e 或 f（交集）
[a-z&&[^bc]]	a 到 z，除了 b 和 c：[ad-z]（减去）
[a-z&&[^m-p]]	a 到 z，而非 m 到 p：[a-lq-z]（减去）
预定义字符类
.	任何字符（与行结束符可能匹配也可能不匹配）
\d	数字：[0-9]
\D	非数字： [^0-9]
\s	空白字符：[ \t\n\x0B\f\r]
\S	非空白字符：[^\s]
\w	单词字符：[a-zA-Z_0-9]
\W	非单词字符：[^\w]
POSIX 字符类（仅 US-ASCII）
\p{Lower}	小写字母字符：[a-z]
\p{Upper}	大写字母字符：[A-Z]
\p{ASCII}	所有 ASCII：[\x00-\x7F]
\p{Alpha}	字母字符：[\p{Lower}\p{Upper}]
\p{Digit}	十进制数字：[0-9]
\p{Alnum}	字母数字字符：[\p{Alpha}\p{Digit}]
\p{Punct}	标点符号：!"#$%&'()*+,-./:;<=>?@[\]^_`{\|}~
\p{Graph}	可见字符：[\p{Alnum}\p{Punct}]
\p{Print}	可打印字符：[\p{Graph}\x20]
\p{Blank}	空格或制表符：[ \t]
\p{Cntrl}	控制字符：[\x00-\x1F\x7F]
\p{XDigit}	十六进制数字：[0-9a-fA-F]
\p{Space}	空白字符：[ \t\n\x0B\f\r]
java.lang.Character 类（简单的 java 字符类型）
\p{javaLowerCase}	等效于 java.lang.Character.isLowerCase()
\p{javaUpperCase}	等效于 java.lang.Character.isUpperCase()
\p{javaWhitespace}	等效于 java.lang.Character.isWhitespace()
\p{javaMirrored}	等效于 java.lang.Character.isMirrored()
Unicode 块和类别的类
\p{InGreek}	Greek 块（简单块）中的字符
\p{Lu}	大写字母（简单类别）
\p{Sc}	货币符号
\P{InGreek}	所有字符，Greek 块中的除外（否定）
[\p{L}&&[^\p{Lu}]]	所有字母，大写字母除外（减去）
边界匹配器
^	行的开头
$	行的结尾
\b	单词边界
\B	非单词边界
\A	输入的开头
\G	上一个匹配的结尾
\Z	输入的结尾，仅用于最后的结束符（如果有的话）
\z	输入的结尾
Greedy 数量词
X ?	X ，一次或一次也没有
X *	X ，零次或多次
X +	X ，一次或多次
X {n }	X ，恰好 n 次
X {n ,}	X ，至少 n 次
X {n ,m }	X ，至少 n 次，但是不超过 m 次
Reluctant 数量词
X ??	X ，一次或一次也没有
X *?	X ，零次或多次
X +?	X ，一次或多次
X {n }?	X ，恰好 n 次
X {n ,}?	X ，至少 n 次
X {n ,m }?	X ，至少 n 次，但是不超过 m 次
Possessive 数量词
X ?+	X ，一次或一次也没有
X *+	X ，零次或多次
X ++	X ，一次或多次
X {n }+	X ，恰好 n 次
X {n ,}+	X ，至少 n 次
X {n ,m }+	X ，至少 n 次，但是不超过 m 次
Logical 运算符
XY	X 后跟 Y
X \|Y	X 或 Y
(X )	X，作为捕获组
Back 引用
\n	任何匹配的 n th 捕获组
引用
\	Nothing，但是引用以下字符
\Q	Nothing，但是引用所有字符，直到 \E
\E	Nothing，但是结束从 \Q 开始的引用
特殊构造（非捕获）
(?:X )	X ，作为非捕获组
(?idmsux-idmsux)	Nothing，但是将匹配标志由 on 转为 off
(?idmsux-idmsux: X )	X ，作为带有给定标志 on - off 的非捕获组
(?=X )	X ，通过零宽度的正 lookahead
(?!X )	X ，通过零宽度的负 lookahead
(?<=X )	X ，通过零宽度的正 lookbehind
(?<!X )	X ，通过零宽度的负 lookbehind
(?>X )	X ，作为独立的非捕获组

组和捕获

捕获组可以通过从左到右计算其开括号来编号。例如，在表达式 ((A)(B(C))) 中，存在四个这样的组：

1	((A)(B(C)))
2	\A
3	(B(C))
4	(C)

thoughtfly

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
正则基本知识

表达式的构造正则表达式中/i,/g,/ig,/gi,/m的区别和含义/i (忽略大小写)/g(全文查找出现的所有匹配字符)/m (多行查找)/gi(全文查找、忽略大小写)/ig(全文查找、忽略大小写) \t制表符 ('\u0009')\n新行（换行）符 ('\u000A')...
复制链接

扫一扫

专栏目录