右键点击百度首页LOGO,审查元素,我们可以看到以下内容
在HTML处理中,经常会用到正则表达式,对内容进行过滤,提取目标内容
没有正则基础的小伙伴可以先了解下点击打开
在线正则表达式匹配测试点击打开
我们引入一个匹配模板
public static String RegexString(String targetStr,String patternStr){
//定义一个样式模板
Pattern pattern = Pattern.compile(patternStr);
//定义一个matcher来做匹配
Matcher matcher = pattern.matcher(targetStr);
//开始匹配
if(matcher.find()){
return matcher.group(1);
}
return "";
}
现在要做的就是构造出相应的正则语句
图片标签<img hidefocus="true" src="//www.baidu.com/img/bd_logo1.png" width="270" height="129">
我们发现只要抓出src="******",中间的内容就可以了
所以我们定义</