大数据面试题_分析计算层

大数据:

  Kylin:

  简介Kylin

  Kylin的工作原理

  Kylin的技术框架

  Cube、Cuboid 和 Cube Segment

  Kylin 对维度表的的要求

  Cube的构建过程

  全量构建和增量构建的区别

  流式构建原理

Hive:

  Hive内部表与外部表的区别

  Hive与传统数据库的区别

  Hiverc文件

  Hive分区

  Hive分区过多有何坏处以及分区时的注意事项

  Hive中复杂数据类型的使用好处与坏处

  hive分桶?

  Hive元数据库是用来做什么的,存储哪些信息?

  为何不使用Derby作为元数据库?

  Hive什么情况下可以避免进行mapreduce?

  Hive连接?

  Hive MapJoin?

  Hive的sort by, order by, distribute by, cluster by区别?

  Hadoop计算框架特性

  Hive优化常用手段

  数据倾斜整理(转)

  使用Hive如何进行抽样查询?

Storm:

  Storm的可靠性如何实现?包括spout和bolt两部分

  怎么提高Storm的并发度?

  Storm如何处理反压机制?

  Storm中的Stream grouping有哪几种方式?

  Storm的组件介绍

  Storm怎么完成对单词的计数?

  简述Strom的计算结构

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值