正则表达式:字符串中连续重复字符串的识别和替换

今天编程的时候遇到一个正则表达式查找和替换的问题:对于字符串连续出现的字符,用“(重复字符)”替换。我想到用正则表达式比较高效。

对于字符串中的连续重复的字符,正则表达式是:

(.)\1+

以下是程序的片段:

 Pattern pattern = Pattern.compile("(.)\\1+");
 Matcher matcher = pattern.matcher("111234445466");
 //sb 缓冲区作为存储替换后的结果
 StringBuffer sb = new StringBuffer();
 //用正则表达式的find函数去判断,有没有匹配的结果集
 while (matcher.find()) {
    //match.group(0) 是匹配的字符串,比如111234445466中的111
    //match.group(1) 是匹配的字符串的单个字符,比如111234445466中的111中的1
    String repeat = matcher.group(1);
    //appendReplacement用第二个参数去替换匹配成功的子串,并把结果存放在sb中,前面未匹配成功的也会放进去,后面的未匹配成功的不会放进去。例如:11123444546634 最后会替换成(1)23(4)54(6)
    matcher.appendReplacement(sb, "("+repeat+")" );
 }
 //把后面未匹配成功的附加到sb上,例如:11123444546634 最后会替换成(1)23(4)54(6)34
 matcher.appendTail(sb);
 return sb.toString();
展开阅读全文

没有更多推荐了,返回首页