jsoup 网络爬虫 基础文档

jsoup 简介:[url]http://871421448.iteye.com/blog/1545996[/url]

jsoup API 文档:[url]http://jsoup.org/apidocs/[/url]

jsoup Jar包下载:[url]http://jsoup.org/download[/url]

示例1:[url]http://blog.csdn.net/withiter/article/details/15339579[/url]

示例2:[url]http://blog.csdn.net/huzhengnan/article/details/22883383[/url]

使用JSOUP实现网络爬虫,网络专栏:[url]http://blog.csdn.net/column/details/jsoup.html[/url]


[color=blue][b]htmlunit是一款开源的java 页面分析工具,读取页面后,可以有效的使用htmlunit分析页面上的内容。项目可以模拟浏览器运行,被誉为java浏览器的开源实现。这个没有界面的浏览器,运行速度也是非常迅速的。htmlunit采用的是rhino作为javascript的解析引擎。[/b][/color]

gecco 1.0.5 发布了,gecco 是易用的轻量化网络爬虫。

主要改进:

1、修复redirect的相对url的bug

2、增加了支持htmlunit的插件

3、增加抓取JD全部商品的demo

下载地址:
[url]https://github.com/xtuhcy/gecco/archive/1.0.5.zip[/url]
[url]https://github.com/xtuhcy/gecco/archive/1.0.5.tar.gz[/url]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值