java爬虫爬取百度图片_java多线程爬虫爬取百度图片

478e04e03867d9077fc8e808859d5419.png

在网络爬虫中,python爬虫和java爬虫都有多线程,python虽然代码简单易操作,但是在多线程操作中,python 不及java。如果想要加快爬虫速度,可以采用java多线程网络爬虫的方法。本文介绍java爬虫使用多线程的方法爬取百度图片。

一、java多线程

线程是指一个任务从头至尾的执行流。

线程提供了运行一个任务的机制。

对于Java而言,可以在一个程序中并发地启动多个线程。这些线程可以在多处理器系统上同时运行。

二、使用java多线程网络爬虫:设计构造器。

1、获取想要的页面public class major {

public static void main(String[] args) {

int sum = 0;

List urlMains = new ArrayList<>();

List imageUrls = new ArrayList<>();

//首先得到10个页面

urlMains = CreateUrl.CreateMainUrl();

out.println(urlMains.size());

for(String urlMain : urlMains) {

out.println(urlMain);

}

2、使用Jsoup和FastJson解析出所有的图片源链接imageUrls = CreateUrl.CreateImageUrl(urlMains);

for(String imageUrl : imageUrls) {

out.println(imageUrl);

}

3、创建出每个图片所属的文件夹,并对图片源链接进行下载(使用多线程进行下载)创建进程ImageFile.createDir();

int average = imageUrls.size()/10;

for(int i = 0; i 

int begin = sum;

sum += average;

int last = sum;

Thread image = null;

if(i 

image = new Thread(new ImageFile(begin, last,

(ArrayList) imageUrls));

} else {

image = new Thread(new ImageFile(begin, imageUrls.size(),

(ArrayList) imageUrls));

}

image.start();

}

}

}

以上就是使用java多线程爬虫实现爬取百度图片的过程,还是很容易理解操作的,大家可以尝试看看哦~更多java教程:java教程。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值