正则表达式

最新推荐文章于 2020-08-27 11:54:28 发布

weixin_30333885

最新推荐文章于 2020-08-27 11:54:28 发布

阅读量126

点赞数

文章标签： javascript 游戏 ViewUI

版权

正则表达式中的反斜杠(\)指示以下情况之一：

字符类模式与一类字符中的任何一个字符匹配。字符类包括下表中列出的语言元素。

*斜线加小写字母表示匹配一类字符，斜线加大写字母表示不匹配一类字符。

模式	否定式	说明	备注
.		匹配除\n之外的任何单个字符。点号在[]和替换字符串表示原有意义，而不是转义字符。	使用s选项，匹配包括\n在内的任何单个字符匹配。
[aeiou]		与[]中的任何单个字符匹配。如[aeiou] 匹配元音字母	字符表中的]字符需要转义。
[^aeiou]		不在[^]中的任何单个字符匹配。如[^aeiou] 匹配不是元音字母的字符
[a-z]		字符范围：与从a到z的范围中的任何单个字符匹配。如[a-z]匹配字母a到z。	如果[]中包括-，应放在第一位置
[a-z-[aeiou]]		字符类减法，匹配这样一个字符，其属于前面字符类，但不属于后面的字符类。如[a-z-[aeiou]]匹配辅音字母
\w	\W	单词字符*	ECMAScript [a-zA-Z_0-9]
\s	\S	空白字符*	ECMAScript [\f\n\r\t\v]
\d	\D	十进制数字*	ECMAScript[0-9]
\p{}	\P{}	表示Unicode已命名组或块范围，如\p{IsCJKUnifiedIdeographs}表示匹配汉字。

定位点或原子零宽度断言会使匹配成功或失败，具体取决于字符串中的当前位置，但它们不会使引擎在字符串中前进或使用字符。下表中列出的元字符是定位点。

模式	否定式	说明	模式	输入字符串	匹配
^		匹配字符串的起点。若指定Multiline选项，则匹配行的起点。	^\d{3}	"901-333-"	"901-"
$		匹配字符串的终点。若指定Multiline选项，则匹配行的终点。	-\d{3}$	"-901-333"	"-333"
\A		匹配字符串的起点。	\A\d{3}	"901-"	"901"
\Z		匹配字符串的末尾。如果字符串以\n结束，则匹配字符串末尾的\n之前。	-\d{3}\Z	"-901-333"	"-333"
\z		匹配字符串的末尾。	-\d{3}\z	"-901-333"	"-333"
\G		连续搜索，匹配上一个匹配的结束点。	\G$\d$	"(1)(3)(5)[7](9)"	"(1)","(3)","(5)"
\b	\B	单词边界，匹配\w和\W之间的点。	\Bend\w*\b	"end sends endure lender"	"ends","ender"
(?=expr)		匹配一点，该点的右侧匹配子表达式。	\w+(?=\.)	"He is. The dog ran. The sun is out."	"is","ran","out"
(?!expr)		匹配一点，该点的右侧不匹配子表达式。	\b(?!un)\w+\b	"unsure sure unity used"	"sure","used"
(?<=expr)		匹配一点，该点的左侧匹配子表达式。	(?<=19)\d{2}\b	"1851 1999 1950 1905 2003"	"99","50","05"
(?<!expr)		匹配一点，该点的左侧不匹配子表达式。	(?<!19)\d{2}\b	"1851 1999 1950 1905 2003"	"51","03"

序列	说明	备注
(expr)	捕获匹配的子表达式。基于模式中左括号的顺序，对分组从1开始编号。第0组表示与整个模式匹配的字符串
(?<name>expr)	将匹配的子表达式捕获到一个命名组中。Name不能包括任何标点符号
(?:expr)	定义非捕获组。与(expr)相同，只是不进行编号
(?>expr)	非回溯子表达式
\|	匹配以竖线(\|)字符分隔的任何一个元素	条件匹配需要注意顺序，先严后宽。(abcd\|abc)
(?(expr)yes\|no)	如果expr匹配，则与yes部分匹配；否则，与可选的no部分匹配。expr被解释为零宽度断言
(?(name)yes\|no)	如果命名捕获name有匹配项，则与yes部分匹配；否则，与可选的no部分匹配
(?<name1-name2>expr)	平衡组定义

序列	说明	模式	输入字符串	匹配
\n	后向引用。匹配编号子表达式的值。与八进制的格式相同，但是优先被认为是后向引用	(\w)\1	seek	ee
\k<name>	命名后向引用。匹配命名表达式的值	(?<ch>\w)\d\k<ch>		B2B

默认情况下，正则表达式模式中带有任意文本字符的输入字符串比较区分大小写，正则表达式模式中的空白将被解释为文本空白字符且正则表达式中的捕获组通过隐式和显式命名。可通过指定正则表达式选项修改默认正则表达式行为的这些和其他数个方面。

RegexOptions成员	内联字符	效果
None		使用默认行为。
IgnoreCase	i	使用不区分大小写的匹配。
Multiline	m	使用多行模式，其中^和$匹配每行的开头和末尾（不是输入字符串的开头和末尾）。
Singleline	s	使用单行模式,点号(.)匹配所有字符(而不是除了\n的所有字符)。又称作dotall。
ExplicitCapture	n	不捕获未命名的组。唯一有效的捕获是显式命名或编号的((?<name>expr))形式的组。
IgnorePatternWhitespace	x	从模式中排除未转义的空白，并启用数字符号(#)后的注释。
Compiled		将正则表达式编译为程序集。
RightToLeft		更改搜索方向。搜索是从右向左而不是从左向右进行。
ECMAScript		为表达式启用符合ECMAScript的行为。ECMAScript选项只能与IgnoreCase和Multiline选项组合使用。
CultureInvariant		忽略语言的区域性差异。

构造	定义	模式	输入字符串	匹配
(?imnsx-imnsx)	指定正则表达式选项，从当前位置至模式字符串终点的范围内启用/禁用一个或多个选项	\bA(?i)b\w+\b	"ABA Able Act"	"ABA","Able"
(?imnsx-imnsx:expr)	对表达式expr启用或禁用正则表达式选项	A\d{2}(?i:\w+)\b	"A12xl A12XL a12xl"	"A12xl","A12XL"
(?# 注释)	内联注释，该注释在第一个右括号处终止	\bA(?#words starting with A)\w+\b
#[至行尾]	启用IgnorePatternWhitespace时，该注释以非转义的#开头，并继续到行的结尾	(?x)\bA\w+\b#words starting with A

替换模式中唯一需要转义的字符就是美元符号。