转载自:
http://blog.csdn.net/bbirdsky/article/details/45368709
http://blog.csdn.net/bbirdsky/article/details/45368709
1、 文本中有\r\n等制表符时,正则表达式字符串直接使用\r\n(单斜杠)来匹配 如:Pattern pa = Pattern.compile("\r\n"); Matcher ma = pa.matcher(str); 2、 文本中含有正则表达式需要的特殊字符时,如果需要对特殊字符进行匹配,需要在特殊字符前\\(双斜杠)转义 如:
Pattern pa = Pattern.compile("\\["); Matcher ma = pa.matcher(str); 或者:
Pattern pa = Pattern.compile("\\S\\s"); Matcher ma = pa.matcher(str);
正则需要转义字符有:'$', '(', ')', '*', '+', '.', '[', ']', '?', '\\', '^', '{', '}', '|'
异常现象: java.util.regex.PatternSyntaxException: Dangling meta. character '*' near index 0解决方法: 对特殊字符加\\转义即可。
注意:虽然使用[]在部分条件下也可以,但是在对于(、[、{范围边界开始符不匹配的情况下会报如下:异常现象:java.util.regex.PatternSyntaxException: Illegal repetition near index 50
Java过滤正则表达式特殊字代码如下(注意:\\需要第一个替换,否则replace方法替换时会有逻辑bug)
public static String escapeExprSpecialWord(String keyword) { if (StringUtils.isNotBlank(keyword)) { String[] fbsArr = { "\\", "$", "(", ")", "*", "+", ".", "[", "]", "?", "^", "{", "}", "|" }; for (String key : fbsArr) { if (keyword.contains(key)) { keyword = keyword.replace(key, "\\" + key); } } } return keyword; } 3、 文本中含有\(单斜杠)时,如果需要对\(单斜杠)进行匹配,需要\\\\(四个斜杠) 如:
Pattern pa = Pattern.compile("\\\\"); Matcher ma = pa.matcher(str);