话不多说,以新浪财经谷歌公司的股票报价为例
http://stock.finance.sina.com.cn/usstock/quotes/GOOG.html
很容易就可以得到谷歌公司的名称、编码。
可是,可是!!
593.35,-2.63之类的数据,在脚本里就是找不出来!
像财经网站等信息更新很频繁的,或者为了加密等需要的网站,就会使用这种方法,起到对数据的一种隐藏。那是不是我们就没法抓到这个数据了呢
人民群众的力量是无穷大的!抓包神器HTTPAnalyzer,还有汉化版的,用起来很方便。
先装一个Firefox...
再装一个analyzer...会提示进程监听哪个,选择Firefox就好。
点击开始,然后把网址复制到Firefox地址栏,打开
可以看到进程跳出了很多奇奇怪怪的东西。。
点击Response Content,我们可以通过点击不同的进程查看content
(这时候可以点红色的圆停止,相信我们要的信息都已经弄下来啦)
找啊找,最后找到下面这个
看到593.35有木有!还有-0.44神马的,copy下来
谷歌,593.35,-0.44,2014-07-25 08:41:25,-2.63,596.45,599.50,591.77,1228.88,502.80,1029070,1822078,401045265000,19.09,31.08,0.00,1.14,0.00,0.00,675900000,21.00,591.50,0.00,0.00,,Jul 24 04:00PM EDT,595.98,0.00
跟网页进行比对,很不巧就是上面第二张截图的数据
再继续看content
顺带着还有其他公司的数据呢~
导出excel,还可以得到网址~~
不过貌似加密了,可能设置了referer,不能直接跳转