【前言 大数据白皮书(2014)的概括和总结。
【正文】
大数据为什么到来?
2000 年前后,互联网(特别是网页)爆发式发展,每天新增约700 万个
网页,用户检索信息越来越不方便。谷歌等公司率先建立了覆盖数十亿网页的索引库,开始提供
较为精确的搜索服务,大大提升了人们使用互联网的效率,这是大数据应用的起点。
当时搜索引擎要存储和处理的数据,不仅数量之大所未有,而且以非结构化数据为主,传统技术无法应对。为此陆续推出的分布式文件系统(GFS,Google File
【前言 大数据白皮书(2014)的概括和总结。
【正文】
大数据为什么到来?
2000 年前后,互联网(特别是网页)爆发式发展,每天新增约700 万个
网页,用户检索信息越来越不方便。谷歌等公司率先建立了覆盖数十亿网页的索引库,开始提供
较为精确的搜索服务,大大提升了人们使用互联网的效率,这是大数据应用的起点。
当时搜索引擎要存储和处理的数据,不仅数量之大所未有,而且以非结构化数据为主,传统技术无法应对。为此陆续推出的分布式文件系统(GFS,Google File