正则表达式中?=和?:和?!的理解

最新推荐文章于 2024-04-19 16:47:26 发布

SummerNH_6

最新推荐文章于 2024-04-19 16:47:26 发布

阅读量999

点赞数 1

分类专栏： JavaScript 文章标签：正则表达式

JavaScript 专栏收录该内容

13 篇文章 0 订阅

订阅专栏

要理解?=和?!，首先需要理解前瞻，后顾，负前瞻，负后顾四个概念：

前瞻：
exp1(?=exp2) 查找exp2前面的exp1
后顾：
(?<=exp2)exp1 查找exp2后面的exp1
负前瞻：
exp1(?!exp2) 查找后面不是exp2的exp1
负后顾：
(?<!=exp2)exp1 查找前面不是exp2的exp1

举例：

"中国人".replace(/(?<=中国)人/, "rr") // 匹配中国人中的人，将其替换为rr，结果为 中国rr
"法国人".replace(/(?<=中国)人/, "rr") // 结果为 法国人，因为人前面不是中国，所以无法匹配到

()表示捕获分组，()会把每个分组里的匹配的值保存起来，使用$n(n是一个数字，表示第n个捕获组的内容)

(?:)表示非捕获分组，和捕获分组唯一的区别在于，非捕获分组匹配的值不会保存起来。

举例：

?= 是正向肯定断言，进行的匹配是不占查询长度的；而 ?: 是非获取匹配，进行的匹配是占据查询长度的。

// 数字格式化 1,123,000
"1234567890".replace(/\B(?=(?:\d{3})+(?!\d))/g,",") // 结果：1,234,567,890，匹配的是后面是3*n个数字的非单词边界(\B)

$1、$2、...、$99	与 regexp 中的第 1 到第 99 个子表达式相匹配的文本。
$&	与 regexp 相匹配的子串。
$`	位于匹配子串左侧的文本。
$'	位于匹配子串右侧的文本。
$$	直接量符号。

"123456789".replace(/(\d{3})(?:[^$])/g, "$1,");
()表示捕获型括号，(?:)表示非捕获型括号，所以第一个括号匹配的内容会放在$1中，第二个括号匹配的内容不会放在$2中。\d{3}表示连续三个数字，[^$]表示匹配一个字符，只要这个字符不是$符号，需要注意的是[]表示匹配里面的任意一个字符，但是肯定是要有一个的，所以[]匹配出来的字符的长度肯定是1，不存在0的情况，另外在[$]里面的$符号是没有特殊含义的，就是$这个字符，而不是匹配字符串的结尾。
因为\d{3}匹配三个字符，[^$]匹配一个字符，所以这个正则匹配4个字符；来看匹配过程，首先"1234"是满足的，"123"匹配\d{3}，"4"匹配[^$]，此时$1="123"，所以"1234"被替换成"123,"。然后从5开始下次匹配，类似的"5678"满足条件，$1="567"，所以"5678"被替换成"567,"。然后从9开始匹配，下面没有匹配了，匹配结束，结果为"123,567,9"。
"1234567".replace(/\B(?:(\d{3})+(?!\d))/g, ",");
\B匹配非单词边界，也是一个位置，没有宽度，(\d{3})+匹配3的倍数数字序列，且个数至少是3个，+是量词，表示1到多次，默认是贪婪的，贪婪就是尽可能多的匹配，(?!d)表示这个位置后面不是数字。
看例子，首先\B不匹配行首，所以匹配的位置移动到"1"后面的位置，此时\B匹配1后面的位置，然后"234", "567"匹配d{3}，因为是贪婪匹配，所以(d{3})+匹配"234567"，然后因为7后面是字符串的结尾了，所以满足断言(?!\d)不是数字，所以整个正则的匹配结果是"234567"，所以"234567"被替换成了","。1不动，所以"1234567"变成了"1,"。
"123456789".replace(/(\d{3})(?=[^$])/g, "$1,");
这个正则表达式不满足"千分位添加逗号"的需求，"123456789"只是个特例（位数正好是3的倍数），换成"12345678"结果是"123,456,78"。

SummerNH_6

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
正则表达式中?=和?:和?!的理解

要理解?=和?!，首先需要理解前瞻，后顾，负前瞻，负后顾四个概念：前瞻：exp1(?=exp2) 查找exp2前面的exp1后顾：(?&lt;=exp2)exp1 查找exp2后面的exp1负前瞻：exp1(?!exp2) 查找后面不是exp2的exp1负后顾：(?&lt;!=exp2)exp1 查找前面不是exp2的exp1举例："中国人".replace(/(?&...
复制链接

扫一扫