使用多线程爬取数据
之前的博客李介绍了多线程的使用以及如何简单使用java的爬虫,本文把二者做一个简单的结合,使用多线程同时查不同的网址,最后把结果合并
没有通过正则表达式来爬取不同的网址,直接写死4个网址来让不同的线程爬取
MultiThreadQueryUtil2
@Service
public class MultiThreadQueryUtil2 {
public static void main(String[] args) {
List<List> multiCombineResult = getMultiCombineResult();
System.out.println(multiCombineResult);
}
/**
* 获取多线程结果并进行结果合并
* @return
*/
public static List<List> getMultiCombineResult() {
//开始时间
long start = System.currentTimeMillis();
//返回结果
List<List> result = new ArrayList<>();
List<String> webs = new ArrayList<>();
webs.add("https://taolitop.com/");
webs.add("https://taolitop.com/jj.whtml");
webs.add("https://taolitop.com/dzhrjsjykf.whtml");
webs.