java爬虫爬取百度图片_java多线程爬虫爬取百度图片

最新推荐文章于 2024-03-22 11:01:19 发布

啊西久

最新推荐文章于 2024-03-22 11:01:19 发布

阅读量366

点赞数

文章标签： java爬虫爬取百度图片

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_34687748/article/details/114689635

版权

在网络爬虫中，python爬虫和java爬虫都有多线程，python虽然代码简单易操作，但是在多线程操作中，python 不及java。如果想要加快爬虫速度，可以采用java多线程网络爬虫的方法。本文介绍java爬虫使用多线程的方法爬取百度图片。

一、java多线程

线程是指一个任务从头至尾的执行流。

线程提供了运行一个任务的机制。

对于Java而言，可以在一个程序中并发地启动多个线程。这些线程可以在多处理器系统上同时运行。

二、使用java多线程网络爬虫：设计构造器。

1、获取想要的页面public class major {

public static void main(String[] args) {

int sum = 0;

List urlMains = new ArrayList<>();

List imageUrls = new ArrayList<>();

//首先得到10个页面

urlMains = CreateUrl.CreateMainUrl();

out.println(urlMains.size());

for(String urlMain : urlMains) {

out.println(urlMain);

}

2、使用Jsoup和FastJson解析出所有的图片源链接imageUrls = CreateUrl.CreateImageUrl(urlMains);

for(String imageUrl : imageUrls) {

out.println(imageUrl);

}

3、创建出每个图片所属的文件夹，并对图片源链接进行下载(使用多线程进行下载)创建进程ImageFile.createDir();

int average = imageUrls.size()/10;

for(int i = 0; i

int begin = sum;

sum += average;

int last = sum;

Thread image = null;

if(i

image = new Thread(new ImageFile(begin, last,

(ArrayList) imageUrls));

} else {

image = new Thread(new ImageFile(begin, imageUrls.size(),

(ArrayList) imageUrls));

}

image.start();

}

}

}

以上就是使用java多线程爬虫实现爬取百度图片的过程，还是很容易理解操作的，大家可以尝试看看哦~更多java教程：java教程。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
java爬虫爬取百度图片_java多线程爬虫爬取百度图片

在网络爬虫中，python爬虫和java爬虫都有多线程，python虽然代码简单易操作，但是在多线程操作中，python 不及java。如果想要加快爬虫速度，可以采用java多线程网络爬虫的方法。本文介绍java爬虫使用多线程的方法爬取百度图片。一、java多线程线程是指一个任务从头至尾的执行流。线程提供了运行一个任务的机制。对于Java而言，可以在一个程序中并发地启动多个线程。这些线程可以在多处...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。