要理解?=和?!,首先需要理解前瞻,后顾,负前瞻,负后顾四个概念:
前瞻:
exp1(?=exp2) 查找exp2前面的exp1
后顾:
(?<=exp2)exp1 查找exp2后面的exp1
负前瞻:
exp1(?!exp2) 查找后面不是exp2的exp1
负后顾:
(?<!=exp2)exp1 查找前面不是exp2的exp1
举例:
"中国人".replace(/(?<=中国)人/, "rr") // 匹配中国人中的人,将其替换为rr,结果为 中国rr
"法国人".replace(/(?<=中国)人/, "rr") // 结果为 法国人,因为人前面不是中国,所以无法匹配到
()表示捕获分组,()会把每个分组里的匹配的值保存起来,使用$n(n是一个数字,表示第n个捕获组的内容)
(?:)表示非捕获分组,和捕获分组唯一的区别在于,非捕获分组匹配的值不会保存起来。
举例:
?= 是正向肯定 断言,进行的匹配是不占查询长度的;而 ?: 是非获取匹配,进行的匹配是占据查询长度的。
// 数字格式化 1,123,000
"1234567890".replace(/\B(?=(?:\d{3})+(?!\d))/g,",") // 结果:1,234,567,890,匹配的是后面是3*n个数字的非单词边界(\B)
$1、$2、...、$99 | 与 regexp 中的第 1 到第 99 个子表达式相匹配的文本。 |
$& | 与 regexp 相匹配的子串。 |
$` | 位于匹配子串左侧的文本。 |
$' | 位于匹配子串右侧的文本。 |
$$ | 直接量符号。 |
-
"123456789".replace(/(\d{3})(?:[^$])/g, "$1,");
()
表示捕获型括号,(?:)
表示非捕获型括号,所以第一个括号匹配的内容会放在$1中,第二个括号匹配的内容不会放在$2
中。\d{3}
表示连续三个数字,[^$]
表示匹配一个字符,只要这个字符不是$符号,需要注意的是[]
表示匹配里面的任意一个字符,但是肯定是要有一个的,所以[]
匹配出来的字符的长度肯定是1,不存在0的情况,另外在[$]
里面的$符号是没有特殊含义的,就是$这个字符,而不是匹配字符串的结尾。
因为\d{3}
匹配三个字符,[^$]
匹配一个字符,所以这个正则匹配4个字符;来看匹配过程,首先"1234"是满足的,"123"匹配\d{3}
,"4"匹配[^$]
,此时$1="123"
,所以"1234"被替换成"123,"。然后从5开始下次匹配,类似的"5678"满足条件,$1="567"
,所以"5678"被替换成"567,"。然后从9开始匹配,下面没有匹配了,匹配结束,结果为"123,567,9"。 -
"1234567".replace(/\B(?:(\d{3})+(?!\d))/g, ",");
\B
匹配非单词边界,也是一个位置,没有宽度,(\d{3})+
匹配3的倍数数字序列,且个数至少是3个,+
是量词,表示1到多次,默认是贪婪的,贪婪就是尽可能多的匹配,(?!d)表示这个位置后面不是数字。
看例子,首先\B
不匹配行首,所以匹配的位置移动到"1"后面的位置,此时\B
匹配1后面的位置,然后"234", "567"匹配d{3},因为是贪婪匹配,所以(d{3})+匹配"234567",然后因为7后面是字符串的结尾了,所以满足断言(?!\d)
不是数字,所以整个正则的匹配结果是"234567",所以"234567"被替换成了","
。1不动,所以"1234567"变成了"1,"。 -
"123456789".replace(/(\d{3})(?=[^$])/g, "$1,");
这个正则表达式不满足"千分位添加逗号"的需求,"123456789"只是个特例(位数正好是3的倍数),换成"12345678"结果是"123,456,78"。