当一个界面中有HTML代码,我们想获取该界面中的图片URL地址的时候可以使用如下代码方式:
/**
* 获取html中的src地址
* 该获取图片地址的方法不能排除video与audio标签中的img
* @param htmlStr
* @return
*/
public static List<String> getImgStr(String htmlStr) {
List<String> pics = new ArrayList<>();
String img = "";
Pattern p_image;
Matcher m_image;
String regEx_img = "<img.*src\\s*=\\s*(.*?)[^>]*?>";
p_image = Pattern.compile(regEx_img, Pattern.CASE_INSENSITIVE);
m_image = p_image.matcher(htmlStr);
while (m_image.find()) {
// 得到<img />数据
img = m_image.group();
// 匹配<img>中的src数据
Matcher m = Pattern.compile("src\\s*=\\s*\"?(.*?)(\"|>|\\s+)").matcher(img);
// Matcher m = Pattern.compile("img src\\s*=\\s*\"?(.*?)(\"