import java.util.ArrayList;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
/**
* @author leemeea
* @date 2021/8/26 20:58
*/
public class TestImg {
public static void main(String[] args) {
String html ="<img src=\"/i/eg_tulip.jpg\" alt=\"上海鲜花港 - 郁金香\" />";
List<String> imgList = new ArrayList<>();
Pattern p_img = Pattern.compile("<(img|IMG)(.*?)(/>|></img>|>)");
Matcher m_img = p_img.matcher(html);
boolean result_img = m_img.find();
if (result_img){
while (result_img) {
//获取到匹配的<img />标签中的内容
String str_img = m_img.group(2);
//开始匹配<img />标签中的src
Pattern p_src = Pattern.compile("(src|SRC)=(\"|\')(.*?)(\"|\')");
Matcher m_src = p_src.matcher(str_img);
if (m_src.find()) {
String str_src = m_src.group(3);
imgList.add(str_src);
}
//结束匹配<img />标签中的src
//匹配content中是否存在下一个<img />标签,有则继续以上步骤匹配<img />标签中的src
result_img = m_img.find();
}
}
}
}
正则表达式获取html中的img的src地址
最新推荐文章于 2023-06-27 14:57:09 发布