RegularExpressions
用途字符串匹配字符串查找字符串替换
类java.lang.Stringjava.util.regex.Patternjava.util.regex.Matcher
1. 初步认识 . * + ?
. 表匹配一个字符
* 零到多个字符
+ 一到多个
? 一个或零个
2. 范围
[abc]
[^abc]
[a-zA-Z]
[a-z] | [A-Z] 或 [a-z[A-Z]]
[A-Z && [RFG]] 交集
\d [0-9]
\D [^0-9]
\s [\t\n\f\r]
\S [^\s]
\w [a-zA-Z_0-9]
e.g: "abc888&^%".matches("[a-z](1,3)\\d+[&^#%]");
3. POSIX style
\p{Lower} 小写字母字符:[a-z]\p{Upper} 大写字母字符:[A-Z]\p{ASCII} 所有 ASCII:[\x00-\x7F]\p{Alpha} 字母字符:[\p{Lower}\p{Upper}]\p{Digit} 十进制数字:[0-9]\p{Alnum} 字母数字字符:[\p{Alpha}\p{Digit}]\p{Punct} 标点符号:!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~\p{Graph} 可见字符:[\p{Alnum}\p{Punct}]\p{Print} 可打印字符:[\p{Graph}\x20]\p{Blank} 空格或制表符:[ \t]\p{Cntrl} 控制字符:[\x00-\x1F\x7F]\p{XDigit} 十六进制数字:[0-9a-fA-F]\p{Space} 空白字符:[ \t\n\x0B\f\r]
4. 边界匹配
^ 行的开头$ 行的结尾\b 单词边界\B 非单词边界\A 输入的开头\G 上一个匹配的结尾\Z 输入的结尾,仅用于最后的结束符(如果有的话)\z 输入的结尾
e.g:
匹配空行 "^[\\s&&[^\\n]]*\\n$"
Email: "\\w[.-]+@[\\w[.-]]+\\.[\\w]+"
5. 匹配查找
Pattern p = Pattern.ciompile("\\d(3,5)");String s = "123-45433-344-00";Matcher m = p.matcher(s);m.matches(); // false 匹配整个字符串m.reset();m.find(); // true 依次往后查找字符串 [m.start() m.end() 匹配字串的起始位置 ]m.find(); // truem.find(); // truem.find(); // false [m.start() 未匹配的抛异常]
m.lookingAt() // true 每次都从开始匹配m.lookingAt() // true
6. 替换
Pattern p = Pattern.compile("java", Pattern.CASE_INSENSITIVE); // 匹配大小写不区分Matcher m = p.matcher("java Java JAvA IloveJaVA you hateJava"); // m.replaceAll("JAVA");
// 将匹配到的单数个java替换为大写,双数替换为小写StringBuffer buf = new StringBuffer();int i = 0;while(m.find()) { i++; if(i%2 ==0) m.appendReplacement(buf, "java"); else m.appendReplacement(buf, "JAVA");}m.appendTail(buf);
7. 分组
Pattern p = Pattern.compile("(\\d{3,5})([a-z]{2})"); // 小括号 分组String s = "123aa-34345bb-234cc-00"; Matcher m = p.matcher(s);while(m.find()) { m.group(); m.group(1); m.group(2);}
8. 数量词Greedy 贪婪 默认Reluctant 勉强的,不情愿的 ?Possessive 独占 +
e.g :
// Pattern p = Pattern.compile("(.{3,10})[0-9]");// Pattern p = Pattern.compile("(.{3,10}?)[0-9]");Pattern p = Pattern.compile("(.{3,10}+)[0-9]");String s = "aaaa5bbbb6";Matcher m = p.matcher(s);if(m.find()) p(m.start() + "-" + m.end());else p("not match");
9. 向前引用
e.g:Pattern p = Pattern.compile("(\\d(\\d))\\2"); // 2 为组号String s = "122";Matcher m = p.matcher(s);m.matches(); // true
10. flags 的简写
Pattern p = Pattern.compile("java", Pattern.CASE_INSENSITIVE);"jAVA".matches("(?i)(java)");