Big Data
文章平均质量分 88
Levine-Huang
这个作者很懒,什么都没留下…
展开
-
Impala之04-Impala 如何使用 Hadoop 文件格式【译】
原文:https://www.cloudera.com/documentation/enterprise/5-7-x/topics/impala_file_formats.html Impala 支持几种熟悉的 Apache Hadoop 中使用的文件格式。Impala 可以加载或查询其他 Hadoop 组件如 Pig 或 MapReduce 产生的数据文件,并且 Impala 产生的数原创 2017-04-09 16:05:16 · 1674 阅读 · 0 评论 -
Impala之03-原理、架构分析(2)
上一篇文章《Impala之02-原理、架构分析(1)》介绍了MPP相关背景知识,本文将深入分析Impala系统架构、原理。 下图展示了Impala的系统架构和查询的执行流程。从图中可以看出,Impala自身包含三个模块:Impalad、Statestore和Catalog,并提供CLI(impala shell)、ODBC、JDBC数据访问接口,除此之外它还依赖Hive Metastor原创 2017-04-09 16:01:12 · 1688 阅读 · 0 评论 -
Impala之01-基本介绍
Impala是Cloudera公司主导开发的新型查询系统,是Google Dremel的开源实现。它提供SQL语义,能够查询存储在Hadoop的HDFS和HBase中的PB级大数据。已有的Hive系统虽然也提供了SQL语义,但是由于Hive底层执行使用的是MapReduce引擎,仍然是一个批处理过程,难以满足查询的交互性;相比之下,Impala的最大特点也是最大卖点就是它的快速。 设计目原创 2017-03-30 23:34:07 · 680 阅读 · 0 评论 -
快学scala笔记之01-数据类型
快学scala笔记之01-数据类型原创 2017-04-15 19:19:36 · 292 阅读 · 0 评论