Google是大数据时代的奠基者,其大数据技术架构一直是互联网公司争相学习和 研究的重点,也是行业大数据技术架构的标杆和示范。
1、谷歌的数据中心
谷歌已经建立了世界上最快、最强大、最高质量的数据中心,它的8个主要数据中心都远离其位于加州山景城的总部,分别位于美国南卡罗来纳州的伯克利郡,爱荷华州的康瑟尔布拉夫斯,乔治亚州的道格拉斯郡,俄克拉荷马州的梅斯郡,北卡罗来纳州的勒努瓦,俄勒冈州的达尔斯;另外2个在美国境外,分别是芬兰的哈米纳和比利时的圣吉斯兰。此外,谷歌公司还在中国香港和中国台湾,以及新加坡和智利建立了数据中心。
2、谷歌新一代搜索引擎平台和大数据分析核心技术
Google是GFS MapReduce BigTable的缔造者,但Google 新一代搜索引擎平台正逐步用更强计算能力的系统来替换原有系统,新一代搜索引擎平台有几个核心技术系统:
一是用基于Percolator的增量处理索引系统来取代MapReduce批处理索引系统,这个索引系统被称作Caffeine,它比MapReduce批处理索引系统搜索更快。
二是专为BigTable设计的分布式存储Colossus,也被称为GFS2(二代Google文件系统&#