爬虫
ycpanda
每一次对问题的深究,都会带来新的体会和知识。
展开
-
jsoup select 选择器
转载自:http://blog.csdn.net/zhejingyuan/article/details/11801027方法利用方法:Element.select(String selector)和Elements.select(String selector)。File input = new File("/tmp/input.html");转载 2014-03-04 18:50:23 · 891 阅读 · 0 评论 -
《Apache HttpClient 4.3开发指南》
转载自:http://blog.csdn.net/chszs/article/details/16854747作者:chszs,转载需注明。博客主页:http://blog.csdn.net/chszs一、概述Apache HttpClient 4系列已经发布很久了,但由于它与HttpClient 3.x版本完全不兼容,以至于业内采用此库的公司较少,在互联网上也转载 2014-03-27 00:16:59 · 720 阅读 · 0 评论 -
《用Apache HttpClient实现URL重定向》
作者:chszs,转载需注明。博客主页:http://blog.csdn.net/chszs很多网站都使用了URL重定向技术,把一个原始请求从一个位置路由到另一个位置。原因可能是多方面的,比如域名转发、URL缩写、隐私保护、在同一网站维持相似的域名等。本文讲述怎样使用Apache HTTPComponents HttpClient实现URL重定向。本文使用的工具:1转载 2014-03-27 00:17:47 · 1044 阅读 · 0 评论 -
一个旅游网反爬手段学习---个人笔记
样例网页:http://hotels.ctrip.com/hotel/1055026.html目标:抓取价格1、转载 2014-09-26 10:59:27 · 1616 阅读 · 0 评论