- 博客(2)
- 收藏
- 关注
转载 基于hadoop生态圈的数据仓库实践 —— OLAP与数据可视化(二)
二、Hive、Spark SQL、Impala比较 Hive、Spark SQL和Impala三种分布式SQL查询引擎都是SQL-on-Hadoop解决方案,但又各有特点。前面已经讨论了Hive和Impala,本节先介绍一下SparkSQL,然后从功能、架构、使用场景几个角度比较这三款产品的异同,最后附上分别由cloudera公司和SAS公司出示的关于这三款产品的性能对比报告。1. S
2017-07-01 14:41:26 397
转载 深入理解Spark 2.1 Core (一):RDD的原理与源码分析
本文链接:http://blog.csdn.net/u011239443/article/details/53894611 该论文来自Berkeley实验室,英文标题为:Resilient Distributed Datasets: A Fault-Tolerant Abstraction for In-Memory Cluster Computing。下面的翻译,我是基于博文http://shi
2017-07-01 13:01:11 514
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人