最近在“问答”频道上看到这样的问题:
写道
test123[em:23:]5678[em:4:]
取出中括号中的数字
取出中括号中的数字
很显然大概的正则表达式应该是:[em:(\\d+):]
测试时,出问题了。问题出在‘[’‘]’。因为它们是正则表达式中的特殊字符。
试试转义,失败了。试试用Pattern的compile方法,编译含有[]的正则表达式,也失败了。
。。。。
最后,查看API(真是个好东西),发现了突破口-- 使用Unicode。
@Test
public void testRegx4() {
String source = "test123[em:23:]5678[em:4:]";
Pattern pattern = Pattern.compile("\\u005Bem:(\\d+):\\u005D");
Matcher matcher = pattern.matcher(source);
System.out.println("取得数字:");
while(matcher.find()){
System.out.println("找到:"+matcher.group(1));
}
}
终于,成功了。记录一下!
PS:还进行了更大胆的尝试,将正则表达式中的所有字符都替换为Unicode码,结果依然正确!