垂直搜索
iteye_3033
这个作者很懒,什么都没留下…
展开
-
WebPage网页数据采集API
[size=medium] 从2008年开始做网页数据采集,开始用使用别人编写的API 如HTML Parser、NekoHTML、Jericho HTML Parser(用于解析html网页),HtmlUtil(纯java版浏览器,具有Http协议和Html解析功能,JS执行功能)等,配合 HttpClient(提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包,是H...2011-01-05 18:23:14 · 421 阅读 · 0 评论 -
AutoIt3采集网页中JS生成的数据
[size=medium] 在做了一年多的网页数据采集之后,中途停了几个月,今天经理交代一个任务,采集http://www.365rili.com/huangliQuery.html 中2011年全年的农历日期,例如 2011年1月1日 是“农历11月廿七 庚寅年 戊子月 丙辰日”。开始以为可以直接使用自编的webpage API来采集,但分析源代码之后发现,里面的数据全部是有JS动态...2011-01-05 18:54:08 · 979 阅读 · 0 评论