大数据
雪刀浪子
醉酒高放歌,陌生是朋友。
展开
-
IBM 技术文档:Spark, 快速数据分析的又一选择
IBM 技术文档:Spark, 快速数据分析的又一选择原文出处:http://www.ibm.com/developerworks/library/os-spark/摘要:尽管Hadoop在分布式数据分析领域备受瞩目,但还是有其他选择比典型的Hadoop平台更具优势。Spark是一种可伸缩(scalable)的基于内存计算(In-Memory Computing)的数据分析平台转载 2014-09-26 16:41:51 · 905 阅读 · 0 评论 -
大数据
大数据(Big Data)大数据,官方定义是指那些数据量特别大、数据类别特别复杂的数据集,这种数据集无法用传统的数据库进行存储,管理和处理。大数据的主要特点为数据量大(Volume),数据类别复杂(Variety),数据处理速度快(Velocity)和数据真实性高(Veracity),合起来被称为4V。大数据中的数据量非常巨大,达到了PB级别。而且这庞大的数据之中,不仅仅包转载 2014-12-09 21:23:09 · 940 阅读 · 0 评论 -
Storm, Spark, Hadoop三个大数据处理工具谁将成为主流?
1、大数据核心是什么?===============================为什么要处理大数据?这恐怕是为了发掘其中的隐含价值。将大数据从某个方面进行加工处理得到为特定业务的便利性,甚至是预见性的核心数据。这就是大数据的价值。再者,大数据的量,分析切面、维度都是难易度量的。进而我觉得它的核心就是:①:在指定时间内能分析出结果②:能根据实际需求找到合理的分析切面以转载 2014-09-26 08:37:36 · 1223 阅读 · 0 评论