xuzhichao1231-CSDN博客

转载基于hadoop生态圈的数据仓库实践 —— OLAP与数据可视化（二）

二、Hive、Spark SQL、Impala比较 Hive、Spark SQL和Impala三种分布式SQL查询引擎都是SQL-on-Hadoop解决方案，但又各有特点。前面已经讨论了Hive和Impala，本节先介绍一下SparkSQL，然后从功能、架构、使用场景几个角度比较这三款产品的异同，最后附上分别由cloudera公司和SAS公司出示的关于这三款产品的性能对比报告。1. S

2017-07-01 14:41:26 397

转载深入理解Spark 2.1 Core （一）：RDD的原理与源码分析

本文链接：http://blog.csdn.net/u011239443/article/details/53894611 该论文来自Berkeley实验室，英文标题为：Resilient Distributed Datasets: A Fault-Tolerant Abstraction for In-Memory Cluster Computing。下面的翻译，我是基于博文http://shi

2017-07-01 13:01:11 514

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

转载 基于hadoop生态圈的数据仓库实践 —— OLAP与数据可视化（二）

转载 深入理解Spark 2.1 Core （一）：RDD的原理与源码分析

空空如也

空空如也

转载基于hadoop生态圈的数据仓库实践 —— OLAP与数据可视化（二）

转载深入理解Spark 2.1 Core （一）：RDD的原理与源码分析