HtmlUnit实现ajax网络爬虫(转)
/**
*网上关于网络爬虫实现方式有很多种,但是很多都不支持Ajax,李兄说:模拟才是王道。确实,
*如果能够模拟一个没有界面的浏览器,还有什么不能做到的呢?关于解析Ajax网站的框架也有不少,
*我选择了HtmlUnit,官方网站:http://htmlunit.sourceforge.net/?,htmlunit可以说是一个Java
*版本的无界面浏览器,几乎无所不能,而且...
2013-08-28 22:26:50 ·
386 阅读 ·
0 评论