java多线程爬虫实现

在网络爬虫进行到后期的时候,如果需要爬虫的规模很大,速度需求快,可以使用java爬虫,java爬虫会比python爬虫快一些。本文介绍java爬虫的三种实现方法以及实现java爬虫的具体代码示例。

一、java多线程实现方式

继承Thread类、实现Runnable接口、使用ExecutorService、Callable、Future实现有返回结果的多线程。

继承Thread类、实现Runnable接口方式线程执行完后都没有返回值

使用ExecutorService、Callable、Future是带返回值的。

二、实现java多线程爬虫:在for循环中让每个子线程都执行RunThread类中的run方法

1、创建一个收集线程的列表

 
package multithreading;import java.util.ArrayList;import java.util.List;/**

 * Created by hg_yi on 17-6-13.

 *

 * 线程计数器是一个共享变量

 */public class MultithreadCrawler{

    public static void main(String[] args) throws InterruptedException {        //创建一个收集线程的列表

        List<Thread> threadList = new ArrayList<Thread>();

2、创建线程的个数

 
int threadNum = 5;

 

        RunThread run = new RunThread();

        run.setThreads(threadNum);

 

3、创建5个线程,并对其进行收集

 
for (int i = 0; i < threadNum; i++) {

            Thread thread = new Thread(run);

            thread.start();

            threadList.add(thread);

        }

4、main线程需要等待所有子线程退出

 
 Thread.currentThread().join();

    }

}

以上就是java中实现多线程爬虫的代码示例,大家可以套入代码尝试看看哦~

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值