转载请注明出处!
有时候因为种种原因,我们须要採集某个站点的数据,但因为不同站点对数据的显示方式略有不同!
本文就用Java给大家演示怎样抓取站点的数据:(1)抓取原网页数据;(2)抓取网页Javascript返回的数据。
一、抓取原网页。
这个样例我们准备从http://ip.chinaz.com上抓取ip查询的结果:
第一步:打开这个网页,然后输入IP:111.142.55.73,点击查询button,就能够看到网页显示的结果:
第二步:查看网页源代码,我们看到源代码中有这么一段:
从这里能够看出,查询的结果,是又一次请求一个网页之后显示的。
再看看查询之后的网页地址:
也就是说,我们仅仅要訪问形如这种网址,就能够得到ip查询的结果,接下来看代码:
publi