昨天,别人提出了,要统计一条微博内容中,有多少表情、@了多少人、包含了多少主题等。这个需求,经过查阅网上的资料了解到,通过正则匹配就能解决。方法比较简单。
内容如下:
Pattern p = Pattern.compile(regex);
Matcher m = p.matcher(text);
while (m.find()) {
System.out.println(m.group(1));
}
这里,regex是要查找、替换的字符串,text是文本。
Matcher.find();
此方法可用来判定,是否匹配成功。
另外,还有其它方法可以替换掉文本中的特殊字符:
例如,可以用下面的方法替换掉文本中的换行符:
String str= "xxxxx ";
str=str.replaceAll( "[\\n\\r] ", " ");