使用jsoup获取网页中的元素

最新推荐文章于 2023-09-19 16:34:02 发布

不会飞的鸬鹚

最新推荐文章于 2023-09-19 16:34:02 发布

阅读量850

点赞数

分类专栏： andriod

本文链接：https://blog.csdn.net/qq_36935585/article/details/80777400

版权

andriod 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

在使用百度SDK开发时，需要获取其数据库中给出链接的网页中的图片。查了查百度，决定使用jsoup来获取图片。

jsoup 是一款Java的HTML解析器，可直接解析某个URL地址、HTML文本内容。它提供了一套API，可通过DOM、CSS以及类似于jQuery的操作方法来取出和操作数据。

首先将jsoup.jar文件导入项目中（jsoup包官方下载地址）；
然后新建一个类从而方便项目中多次调用；
接下来就是编写代码来获取网页中的元素了。

package com.hurricanespace.hurricanespace;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

import java.io.IOException;


public class DownLoadPic {

    public static String getURL(String webUrl) throws IOException{
        String src = null;
        Document doc = Jsoup.connect(webUrl).get();
        //获取后缀为jpg的图片
        Elements img = doc.select("img[src~=(?i)\\.(jpe?g)]");
        //遍历元素
        for(Element e : img){
            src=e.attr("src");//获取img中的src路径
        }
        return src;
    }
}