几个月以前就想过怎么获取ESPN的出手数据,在CSDN发帖没解决,不了了之……
如何获得网页flash中的服务器端数据?(XML?)
http://topic.csdn.net/u/20110413/22/dc73e0da-2093-4fa9-bccd-2f76d9f2855f.html
留言问BasketballGeek的站长Ryan J. Parker怎么搞定的,问了两次,第二次终于对我说“Your clue is to find the XML!”。说了等于没说,再度不了了之……
今晚本来是想用httpclient通过链接http://static.espn.go.com/broadband/flash/gameUpdateNBA/shotChart_02.swf?xmlhost=sports.espn.go.com&gameId=310612014下载xml的,试了个程序没成功。
然后无心插柳地用Firefox插件CacheViewer看了下浏览器缓存,一搜espn竟看到了shot.xml的真实地址……
湿了。。。。。。
以前就想到过缓存,出手数据flash里的xml文件肯定有缓存到本地。仅仅是没有因为使用缓存搜索功能而没能在茫茫缓存发现……IE缓存文件夹也能看到xml文件和url,不能搜索url但可以按时间排序,早该发现了……
真实url就是
http://sports.espn.go.com/nba/gamepackage/data/shot?gameId=310612014
虽然不是通过程序员的方式解决的,但至少还是解决了~~~
espn早期缺失多一些,cbs每个赛季出手数据都有不少错误,cbs的shotdata整体误差可接受,但具体到单人单场出手,错误不少。就正确率而言espn应该好不少。有必要的话再整espn的让两个互补,细活暂时就先不管了~
如何获得网页flash中的服务器端数据?(XML?)
http://topic.csdn.net/u/20110413/22/dc73e0da-2093-4fa9-bccd-2f76d9f2855f.html
留言问BasketballGeek的站长Ryan J. Parker怎么搞定的,问了两次,第二次终于对我说“Your clue is to find the XML!”。说了等于没说,再度不了了之……
今晚本来是想用httpclient通过链接http://static.espn.go.com/broadband/flash/gameUpdateNBA/shotChart_02.swf?xmlhost=sports.espn.go.com&gameId=310612014下载xml的,试了个程序没成功。
然后无心插柳地用Firefox插件CacheViewer看了下浏览器缓存,一搜espn竟看到了shot.xml的真实地址……
湿了。。。。。。
以前就想到过缓存,出手数据flash里的xml文件肯定有缓存到本地。仅仅是没有因为使用缓存搜索功能而没能在茫茫缓存发现……IE缓存文件夹也能看到xml文件和url,不能搜索url但可以按时间排序,早该发现了……
真实url就是
http://sports.espn.go.com/nba/gamepackage/data/shot?gameId=310612014
只需要替换最后的gameid数字串,就可以轻松抓回所有相应的shot.xml。
比较简单的抓取方法是使用下载工具(比如迅雷、FlashGet)的导入URL下载列表功能便可多线程多任务下载,缺点是文件重命名会使用shot、shot(1)、shot(2)……的方式。
虽然不是通过程序员的方式解决的,但至少还是解决了~~~
espn早期缺失多一些,cbs每个赛季出手数据都有不少错误,cbs的shotdata整体误差可接受,但具体到单人单场出手,错误不少。就正确率而言espn应该好不少。有必要的话再整espn的让两个互补,细活暂时就先不管了~