使用Java爬取图片

最新推荐文章于 2024-05-14 04:23:04 发布

@西柚～

最新推荐文章于 2024-05-14 04:23:04 发布

阅读量1.7k

点赞数 6

分类专栏：学习过程文章标签： java

@姜姜的Blog

本文链接：https://blog.csdn.net/qq_45590701/article/details/113131145

版权

学习过程专栏收录该内容

5 篇文章 0 订阅

订阅专栏

Java爬取图片

第一步创建一个Maven项目（我是创建的一个springboot项目）

在这里插入图片描述

第二步导入Jsoup包

        <dependency>
            <groupId>org.jsoup</groupId>
            <artifactId>jsoup</artifactId>
            <version>1.10.2</version>
        </dependency>

然后再创建一个包包下新建一个带有main的类

分析网站内容

在这里插入图片描述

之后就是编写爬取图片的代码了

public class JsoupConfig {
    public static void main(String[] args) {
        //爬取网站的url路径
        String url = "https://blog.csdn.net/weixin_42302341/article/details/109778050?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522161156794416780265412610%2522%252C%2522scm%2522%253A%252220140713.130102334..%2522%257D&request_id=161156794416780265412610&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~all~sobaiduend~default-2-109778050.pc_search_result_before_js&utm_term=%E5%9B%BE%E7%89%87&spm=1018.2226.3001.4187";
        try {
            //使用Jsoup解析url
            Document document = Jsoup.parse(new URL(url), 10000);
            //通过标签id获取网页包含图片的标签
            Element elementById = document.getElementById("content_views");
            //获取img标签
            Elements imgs = elementById.getElementsByTag("img");
            //System.out.println(imgs);

            int id = 0;
            //循环遍历把图片src属性遍历出来
            for (Element img : imgs) {
                String src = img.attr("src");
                //System.out.println(src);
                id++;
                
                URL target = new URL(src);
                URLConnection urlConnection = target.openConnection();

                //获取输入流
                InputStream inputStream = urlConnection.getInputStream();
                //获取输出流 这里是下载保存图片到本地的路径
                OutputStream outputStream = new FileOutputStream("E:\\Work\\照片\\" + id +".jpg");

                int temp = 0;
                while ((temp = inputStream.read()) != -1) {
                    outputStream.write(temp);

                }
                System.out.println(id + ".jpg下载完毕!!!");
                outputStream.close();
                inputStream.close();

            }
        } catch (Exception e) {
            e.printStackTrace();
        }

    }
}

效果

在这里插入图片描述

：爬取的网站

@西柚～

关注

6
点赞
踩
22

收藏

觉得还不错? 一键收藏
2
评论
使用Java爬取图片

Java爬取图片第一步创建一个Maven项目（我是创建的一个springboot项目）第二步导入Jsoup包 <dependency> <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <version>1.10.2</version> &l
复制链接

扫一扫