1.正则表达式定义了字符串的模式
正则表达式可以用来搜索、编辑或处理文本。
正则表达式并不仅限于某一种语言(Java,C,C++),但是在每种语言中有细微的差别。
正则中的捕获组是把多个字符当成一个单元来处理的方法,它通过对括号对每组字符区别成单元来获取。
例如,正则表达式 (cat) 创建了单一分组,组里包含"c","a",和"t"。
捕获组是通过从左至右计算其开括号来编号。例如,在表达式((A)(B(C))),有四个这样的组:
- ((A)(B(C)))
- (A)
- (B(C))
- (C)
可以通过调用 matcher 对象的 groupCount 方法来查看表达式有多少个分组。groupCount 方法返回一个 int 值,表示matcher对象当前有多个捕获组。
还有一个特殊的组(group(0)),它总是代表整个表达式。该组不包括在 groupCount 的返回值中。
2.举个实例,分别获取一个字符中的链接或文字,此后你便可以拿到这些组去用了。
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class MactherGroup {
public static void main(String args[]) {
String str = "<a href='//jiangsu.baixing.com/fja=dgj/'>江苏</a>"
+ "<a href='//yongxin.baixing.com/'>永新</a>";
String regex = "<a href='//(.*?)/(.*?)'>([\\u4e00-\\u9fa5]*)</a>";
Pattern r = Pattern.compile(regex);
Matcher ma = r.matcher(str);
while(ma.find())
{
System.out.println("Found value0: " + ma.group(0) );
System.out.println("Found value1: " + ma.group(1) );
System.out.println("Found value2: " + ma.group(2) );
System.out.println("Found value3: " + ma.group(3) );
System.out.println("----------------------------");
}
}
}
3.结果为:
还有什么问题不明白,或者不会
欢迎加入我的Java与Android逆向开发交流QQ群,一起学习,一起进步。