使用jsoup爬取网页资源（某东为例）

最新推荐文章于 2024-04-30 14:28:06 发布

小黑孩.

最新推荐文章于 2024-04-30 14:28:06 发布

阅读量353

点赞数

分类专栏： Java 文章标签： java mybatis spring

本文链接：https://blog.csdn.net/xiaoheihai666/article/details/129056025

版权

Jsoup是一款java版的HTML解析器，可直接解析某个URL地址、HTML文本内容。
解析网页后返回的是一个Document 对象实例，我们可以看到document中有很多类似js的方法
根据相应的标签找到对象的属性，最后输出我们需要的东西即可。

第一步加入依赖

        <dependency>
            <groupId>org.jsoup</groupId>
            <artifactId>jsoup</artifactId>
            <version>1.15.1</version>
        </dependency>

第二步，直接复制粘贴这个工具类即可

public static List<JD> getJD(String keyword) throws IOException {
        List<JD> jds=new ArrayList<>();
        String url="https://search.jd.com/Search?keyword="+keyword+"&enc=utf-8";

        // 连接网页
        Document document = Jsoup.connect(url).get();