HtmlUnit实现ajax网络爬虫
http://collect.dreamrunner.org/02/42
htmlUnit介绍
http://blog.sina.com.cn/s/blog_5f99653f01016w8w.html
最近用htmlunit做网络爬虫 遇到拿不到初始化js加载的数据的问题 最近解决了 写个简单的例子
htmlunit2.12及jsoup1.5.2的jar包
JAVA获取页面元素之HtmlUnit
http://blog.csdn.net/pq258280920/article/details/8865452如何让 htmlunit 执行 javascript 时,不下载整个页面,而只返回url
http://blog.csdn.net/eclipseek/article/details/7363563多个关于HTMLUNIT的文章
http://www.iteye.com/blogs/tag/%E7%BD%91%E9%A1%B5%E6%8A%93%E5%8F%96
网页抓取之新方法 (在java程序中使用jQuery)
http://mybeautiful.iteye.com/blog/1442839
网络爬虫(网络蜘蛛)之网页抓取
http://yshjava.iteye.com/blog/1872006
用htmlunit怎么去获取一个JS加载完成的网页信息?
在网上找到一个cobra做的爬虫实例 说是可以获取到js执行后的html(不过好像有缺陷 不支持js的相互调用 不过还是不错的)
http://blog.csdn.net/cooleagle/article/details/4441990
cobra简单用法——笔记 http://hi.baidu.com/4910269/item/7d94721ba53fed0ee65c3684