在用正则表达式在html代码中找到相应标签后通过分组的方法可以获取整个匹配内容中的你想要的内容
Pattern compile1=Pattern.compile("(<div class=\"channel-detail movie-item-title\" title=\")(.*?)(\">)");
正则表达式中的括号便是一个个分组,想要获取哪个括号中的内容,用下面的函数:
Matcher matcher1=compile1.matcher(line);//进行匹配
System.out.println(matcher1.group(2));//输出第二个括号中匹配到的内容