海量数据处理
talentluke
这个作者很懒,什么都没留下…
展开
-
一文教你看懂大数据的技术生态圈:Hadoop,hive,spark
一文教你看懂大数据的技术生态圈:Hadoop,hive,spark 责任编辑:editor005 | 2015-03-02 13:50:51 本文摘自:中国大数据 大数据本身是个很宽泛的概念,Hadoop生态圈(或者泛生态圈)基本上都是为了处理超过单机尺度的数据处理而诞生的。你可以把它比作一个厨房所以需要的各种工具。锅碗瓢盆,各有各的用处,互相之间又有重合。你可以用汤锅直接当碗吃饭...原创 2015-08-20 16:23:31 · 167 阅读 · 0 评论 -
“大数据” Hadoop,Spark和Storm
大数据(Big Data) 大数据,官方定义是指那些数据量特别大、数据类别特别复杂的数据集,这种数据集无法用传统的数据库进行存储,管理和处理。大数据的主要特点为数据量大(Volume),数据类别复杂(Variety),数据处理速度快(Velocity)和数据真实性高(Veracity),合起来被称为4V。 大数据中的数据量非常巨大,达到了PB级别。而且这庞大的数据之中,不仅...原创 2015-08-20 16:25:32 · 184 阅读 · 0 评论