今天看到代码中有段代码觉得很奇怪,
一开始看着,一脸懵逼,为啥把中文替换掉了,那还要这个方法有什么用?
最后,自己写了一个方法测试了一下,
才发现了猫腻,原来是正则表达式中这个“^”符号有猫腻,意思就是“非”的意思,所以在这段代码的意思就是,将不是中文的字符全部替换掉,也可以理解为,只匹配中文汉字,
然后在网上找了点资料,总结了一下
/^A/会匹配"An e"中的A,但是不会匹配"ab A"中的A,此时^A的意思是“匹配开头的A”,类似的有
/[(^\s+)(\s+$)]/g
(^cat)$
(^cat$)
^(cat)$
^(cat$)
/[^a-z\s]/会匹配"my 3 sisters"中的"3 ",此时^的意思是“非”,类似的有
[^a]表示“匹配除了a的任意字符”。
[^a-zA-Z0-9]表示“找到一个非字母也非数字的字符”。
经过对比,我发现了”^”这个字符在中括号”[]”中被使用的话就表示字符类的否定,如果不是的话就是表示限定开头。我这里说的是直接在”[]”中使用,不包括嵌套使用。
其实也就是说”[]”代表的是一个字符集,”^”只有在字符集中才是反向字符集的意思。