Java hutools + jsoup 快速编写java爬虫

最新推荐文章于 2024-07-04 16:04:39 发布

帅气你勇哥

最新推荐文章于 2024-07-04 16:04:39 发布

阅读量736

点赞数

分类专栏： java javaweb

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/q857637472/article/details/109602824

版权

java 同时被 2 个专栏收录

8 篇文章 0 订阅

订阅专栏

8 篇文章 0 订阅

订阅专栏

新建maven工程并添加依赖

<dependency>
   <groupId>cn.hutool</groupId>
   <artifactId>hutool-all</artifactId>
   <version>5.4.7</version>
</dependency>
<!-- https://mvnrepository.com/artifact/org.jsoup/jsoup -->
<dependency>
  <groupId>org.jsoup</groupId>
  <artifactId>jsoup</artifactId>
  <version>1.13.1</version>
</dependency>

确定需要爬取的页面

确定需要获取的数据（页面元素）

package com.crawler.img;


import cn.hutool.core.io.FileUtil;
import cn.hutool.http.HttpUtil;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

public class App {
    public static void main(String[] args) {
        String result1 = HttpUtil.get("https://www.mmonly.cc/mmtp/");

        Document document = Jsoup.parse(result1);

        Elements masonry_brick_ = document.select(".masonry_brick img");
        for (Element link : masonry_brick_) {
            String src = link.attr("src");
            System.out.println(src);
            HttpUtil.downloadFile(src, FileUtil.file(System.getProperty("user.dir")+"/src/main/resources/"));
        }

    }
}

帅气你勇哥

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

帅气你勇哥 CSDN认证博客专家 CSDN认证企业博客

码龄9年

41: 原创

8万+: 周排名

85万+: 总排名

9万+: 访问

: 等级

1022: 积分

8: 粉丝

26: 获赞

7: 评论

82: 收藏

私信

关注

热门文章

分类专栏

java 8篇
javaweb 8篇
spring 4篇
mybatis 1篇
html5 14篇
CSS 1篇
javascript 22篇
H5开发 4篇
python 8篇
mysql 1篇
react 3篇
es7 2篇
es6 7篇
vue 5篇
前端工程化 10篇

最新评论

SpringBoot静态资源访问太慢
帅气你勇哥: 没听懂，你能说的具体点嘛
SpringBoot静态资源访问太慢
weixin_42513758: 我用的方法是把JDK的随机数生成依赖熵源由默认的阻塞型熵源换成非阻塞的就好了，不过我这边是明显观察到请求阻塞了
SpringBoot静态资源访问太慢
帅气你勇哥: 我这个典型的就是版本问题~，你也可以试试
SpringBoot静态资源访问太慢
LovelyRuby_: 好家伙好家伙好家伙，我也是开启了gzip没用！我干，访问静态资源慢的离谱
NODEJS第一天学习
帅气你勇哥回复 qq_37897876: 嗯，一起交流，你加我吧，857637472

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。