httpclient-3.1 TO HttpClient 4.0.1
需要用java写一个简易网络爬虫,《使用 HttpClient 和 HtmlParser 实现简易爬虫》这篇文档不错。
但文中的代码是针对HttpClient3.1版本的。网上文章也多针对3.*版本。
在eclipse中使用httpclient4.0.1的 httpclient jar ,报“The import ****** cannot be resolved”错误——网上大多文章中的源码不能直接使用。
原因:
httpclient项目升级(url:http://hc.apache.org/httpclient-3.x/index.html)
有些api有变化。具体的调整方法可以参看官方下的工具包的example。
参考资料:
关于HttpClient 4.0.1的使用
http://blog.sina.com.cn/s/blog_49e3d5720100h9tx.html
使用 HttpClient 和 HtmlParser 实现简易爬虫
https://www.ibm.com/developerworks/cn/opensource/os-cn-crawler/