网络爬虫
杭州丹尼
这个作者很懒,什么都没留下…
展开
-
网络爬虫需要的知识
[quote] 第一步,入门就是用java自带的HttpURLConnection获取源码,然后用正则匹配就是一个简单的爬虫。 第二步,你会发现很多网站并不能爬到想要的数据,你需要鸟枪换大炮,使用Apache的Httpclient来进行爬,你下载的包里就有官方教程,你会慢慢了解cookie,或者是一些http请求头,ua等等。源码解析使用Jsoup,非常方便。 第三步,httpclien...原创 2017-03-23 17:42:02 · 308 阅读 · 0 评论 -
网络爬虫
http://injavawetrust.iteye.com/category/353919 http://injavawetrust.iteye.com/blog/2282354 http://injavawetrust.iteye.com/blog/2279513 http://injavawetrust.iteye.com/blog/2279411原创 2016-03-17 16:20:04 · 107 阅读 · 0 评论