从 Dangling meta character 的错误开始
有一个字符串。 里面包含符号加号(+), 现在使用replaceAll() 方法将所有的加号替换为下划线 (_), 示例代码如下:
String str = "+";
String newStr = str.replaceAll("+", "_");
执行之后报如下错误:
java.util.regex.PatternSyntaxException: Dangling meta character '+' near index 0
+
^
at java.util.regex.Pattern.error(Pattern.java:1955)
at java.util.regex.Pattern.sequence(Pattern.java:2123)
at java.util.regex.Pattern.expr(Pattern.java:1996)
at java.util.regex.Pattern.compile(Pattern.java:1696)
at java.util.regex.Pattern.<init>(Pattern.java:1351)
at java.util.regex.Pattern.compile(Pattern.java:1028)
at java.lang.String.replaceAll(String.java:2223)
为什么会出现这个错误呢? Dangling meta character 翻译一下是悬空元字符, 也就是说符号加号属于悬空元字符。 为什么呢?
看一下String 对象类的 replaceAll() 开始, 这个方法的定义如下:
public String replaceAll(String regex, String replacement) {
return Pattern.compile(regex).matcher(this).replaceAll(replacement);
}
也就是说: replaceAll() 使用的是正则表达式进行替换, 而在正则表达式中, 加号用来表示匹配的次数, 在正则表达式中有特别的意义。
除了+ 之外, 在正则表达式中有特殊意义的字符还有: *
, |
, \
等。
如何解决
对于这类特殊字符, 解决的方法肯定就是转义了, 怎么转义呢? 有两种方法:
- 使用两个反斜线
\\
为什么是两个, 转义一般不是一个反斜线就可以了吗? 因为 反斜线本身就是特殊字符, 对反斜线转义之后得到真正的反斜线。所以, 示例代码如下:
newStr = str.replaceAll("\\+", "_");
Assertions.assertTrue(newStr.equals("_"));
- 使用中括号
String str = "+";
String newStr = str.replaceAll("[+]", "_");
Assertions.assertTrue(newStr.equals("_"));
中括号的方式容易理解, 反斜线的方式在其他语言和场景中也经常使用, 使用哪种?可以根据情况选择, 在同一个应用中保持一致即可。