怎样获取图片html的url,获取HTML网页的所有图片的url

主要使用了HtmlParser类解决问题。

必须导入htmlparser.jar包,读者可从网上自行下载。

下面直接贴上源码:

public NodeList parser(String url) throws ParserException{

/**根据Url创建parser对象**/

Parser parser = new Parser(url);

/**设置编码,必须与Url编码一样 **/

parser.setEncoding("utf-8");

/** 构建一个Html页面对象 **/

HtmlPage htmlPage = new HtmlPage(parser);

parser.visitAllNodesWith(htmlPage);

/** 获取Body下面所有的节点,可以想象成类似树状结构 **/

NodeList list = htmlPage.getBody();

/** 建立一个Filter,用于过滤节点,此处获得形如“”这样的节点 **/

NodeFilter filter = new TagNameFilter("IMG");

/** 得到过滤后的节点 **/

list = list.extractAllNodesThatMatch(filter, true);

for(int c =0; c < list.size(); c ++){

ImageTag imageTag=(ImageTag)list.elementAt(c);

/** 输出图片的链接Url **/

System.out.println(imageTag.getImageURL());

}

return list;

}

public static void main(String[] args) throws ParserException {

Demo demo = new Demo();

demo.parser("http://www.163.com");

}

输出结果就是一堆图片的链接了。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值