impala
奔跑的小鲫鱼
关于学习Java的总结以及遇到的问题及解决方法的描述
展开
-
impala的详细介绍--图文描述
Impala 是参照google 的新三篇论文Dremel(大批量数据查询工具)的开源实现,功能类似shark(依赖于hive)和Drill(apache),impala 是clouder 公司主导开发并开源,基于hive 并使用内存进行计算,兼顾数据仓库,具有实时,批处理,多并发等优点。是使用cdh 的首选PB 级大数据实时查询分析引擎。(Impala 依赖cdh 是完全没有问题的,官网说可以...转载 2018-07-25 00:01:30 · 10172 阅读 · 0 评论 -
impala的工作原理的详解(图文)
工作原理: impala属于Cloudera,基于内存的,可用户实时的交互式查询。Cloudera建议Impala集群内存最少128G,Impalad与DataNode运行在同一节点上 impala与Hivemetastore database相集成,这两个组件之间可以共享database和table。如图所示,Impala主要由Impalad, State Store...转载 2018-07-25 00:12:59 · 2495 阅读 · 0 评论