大数据:
Kylin:
简介Kylin
Kylin的工作原理
Kylin的技术框架
Cube、Cuboid 和 Cube Segment
Kylin 对维度表的的要求
Cube的构建过程
全量构建和增量构建的区别
流式构建原理
Hive:
Hive内部表与外部表的区别
Hive与传统数据库的区别
Hiverc文件
Hive分区
Hive分区过多有何坏处以及分区时的注意事项
Hive中复杂数据类型的使用好处与坏处
hive分桶?
Hive元数据库是用来做什么的,存储哪些信息?
为何不使用Derby作为元数据库?
Hive什么情况下可以避免进行mapreduce?
Hive连接?
Hive MapJoin?
Hive的sort by, order by, distribute by, cluster by区别?
Hadoop计算框架特性
Hive优化常用手段
数据倾斜整理(转)
使用Hive如何进行抽样查询?
Storm:
Storm的可靠性如何实现?包括spout和bolt两部分
怎么提高Storm的并发度?
Storm如何处理反压机制?
Storm中的Stream grouping有哪几种方式?
Storm的组件介绍
Storm怎么完成对单词的计数?
简述Strom的计算结构