![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Java网络爬虫
Yes_JiangShuai
默默奋斗的攻城狮 向往掌握技术而不限于技术
展开
-
爬虫中使用的数据结构
我选择HashSet和LinkedList来保存待访问URL和已访问的URL。 package com.js.demo01; /** * 队列用于保存待爬取的URL */ import java.util.LinkedList; public class Queue { private LinkedList queue = new LinkedList(); /** * 入队列原创 2017-06-11 11:10:59 · 1338 阅读 · 0 评论 -
利用Java实现搜索引擎爬虫技术
利用Java实现搜索引擎爬虫技术,此处实现一个简单的小功能,输入一个url,把该页面的图片批量抓取到本地。 package com.js.util; import java.io.BufferedReader; import java.io.File; import java.io.FileOutputStream; import java.io.IOException; import jav原创 2017-06-11 10:11:06 · 4569 阅读 · 2 评论