/**
* 提取字符串内所有的img标签下的src
* @param content
* @return
*/
public static List<String> getImg(String content){
String regex;
List<String> list = new ArrayList<String>();
//提取字符串中的img标签
regex = "<img[^>]+src\\s*=\\s*['\"]([^'\"]+)['\"][^>]*>";
Pattern pa = Pattern.compile(regex, Pattern.DOTALL);
Matcher ma = pa.matcher(content);
while (ma.find())
{
//提取字符串中的src路径
Matcher m = Pattern.compile("src=\"?(.*?)(\"|>|\\s+)").matcher(ma.group());
while(m.find())
{
if("http".equals(m.group(1).substring(0, 4))){//只提取http开头的图片地址
//System.out.println(m.group(1));
list.add(m.group(1));
}
}
}
return list;
}
转载于:https://my.oschina.net/u/1269027/blog/225149