![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
CDH
文章平均质量分 91
CQ阿甘
专注于传统数据库与大数据的研究与应用
--海纳百川,有容乃大
展开
-
轻松学Hadoop系列之 - 理清CDH Hadoop集群安装流程
CDH的官方安装文档提供了几种安装方式,每种安装方式的后面虽然提供了详细步骤,但引用跳转较多,对初学者来说,很快就晕了,最主要困难是什么?英文!英文!英文!,这对很多英文不好的同学就更加难上加难了。所以作为第二篇博客,我们就先来理清一下CDH的安装流程。原创 2016-04-19 14:59:16 · 1666 阅读 · 0 评论 -
Impala源码解析 - 了解Impala Catalog加载过程和到底加载了什么
在一个大型的应用系统,每天都有上百亿甚至上千亿的数据需要加载到Hadoop中,随着数据量达到海量的级别,原本可以轻松搞定的事情,现在都变得非常棘手,不管是在Oracle中还是以Impala作为实时查询引擎的Hadoop中,都会遇到很多让你日思夜想,难以入眠的问题。原创 2016-10-13 22:47:48 · 2825 阅读 · 0 评论 -
实时查询引擎 - Facebook Presto 介绍与应用
Facebook presto是什么,继Facebook创建了HIVE神器后的又一以SQL语言作为接口的分布式实时查询引擎,可以对PB级的数据进行快速的交互式查询。它支持标准的ANSI SQL.包含查询,聚合,JOIN以及窗口函数等。除了Facebook这个创造都在使用外,国内像京东,美团等也都有广泛的使用。原创 2016-11-09 11:29:56 · 4626 阅读 · 0 评论 -
实时查询引擎 - 介绍总结
基于Hadoop的实时查询引擎组件众多,且各有千秋,就当前已介绍的几种:Apache Drill、Presto、HAWQ、Impala,也几各有不同。那么它们到底有什么不同呢,且看这篇简单的总结原创 2016-12-09 23:30:29 · 2543 阅读 · 0 评论 -
实时查询引擎 - Cloudera Impala 介绍与应用
Impala是我使用最多,也是使用非常广泛的实时查询系统。相较于之前介绍的HAWQ, Presto 以及 Drill 等,已经可以找到很多它的相关资料。它同样是基于Hadoop的以SQL语言接口,并提供实时的,高并发的查询MPP类查询引擎。那Impala到底有什么优势呢?原创 2016-11-28 15:30:29 · 6664 阅读 · 0 评论