主要利用了Jsoup,
/**
* 将文本中的相对地址转换成对应的绝对地址
* @param content
* @param baseUrl
* @return
*/
private static String processImgSrc(String content,String baseUrl){
Document document = Jsoup.parse(content);
document.setBaseUri(baseUrl);
Elements elements = document.select("img[src]");
for(Element el:elements){
String imgUrl = el.attr("src");
if (imgUrl.trim().startsWith("/")) {
el.attr("src", el.absUrl("src"));
}
}
return document.html();
}
如果想直接删除,则也可以用正则表达式
String imgSrcRegex = "<img[^<>]*?\\ssrc=['\"]?(.*?)['\"].*?>";