昨天去中旅大厦听了Big Data 2011,感触良深。
与会的多是国内IT业精英,来自baidu、淘宝、新浪、Admaster、阿里等大数据存储专家就当前的Big Data趋势就技术层面作了一次深入交流。作为一次开放式的交流,整体的感觉是GIS界内人士太封闭,从思想到技术,似乎还在十年前。新的技术足以达到让GIS翻天覆地的革新,而GIS界却没有意识到。比人在管理大数据,难度我们不是大数据吗?应该开始思考如何借Big Data之势来从技术上推动GIS,而不是一味的追逐云计算,应该首先从数据管理来着手。
兴趣点一,R语言。神州数码对R进行大幅褒奖,的确,以前忽视了,原来做统计分析还有这么好的东西。值得关注的是最新发布的R已经支持并行计算,并且可以和MapReduce进行结合。此外,R有3400+个算法包,Spatial packet也在其中,显然可以作为并行GIS的一部分——统计分析并行化。
兴趣点二,OceanBase。淘宝真的是难能可贵,开源了其最近上线的分布式数据存储技术。刚才svn下来看了下,值得好好学习。OceanBase似乎是走中间路线,在兼容Sql的基础上,寻求NoSql的性能。
兴趣点三,yahoo s4,twitter storm