Hadoop(二)答辩题问题

1.什么是shuffle?shuffle的流程
2.hadoop调度器?
3.什么是etl?
4.hive的数据类型
5.分桶的理解
6.hive的四大器
7.hive的索引
8.hive元数据的三种存储方式
9.hadoop内置的输出文件的格式
10.hive元数据默认保存的位置
11.hive 的内置函数
12.hive的优化
13.如何理解分区
14.hive的存储格式
15.如何实现动态分区
16.hive最大的优点
17.hive中的数据倾斜
18.排序
19.内部表和外部表的区别
20.job和tast的区别
21.二次排序
22.mr的优化
23.如何创建一个udaf函数
24.hive和hadoop的关系
25.分区的意义
26.mr的应用场景
27.hive的架构
28.mr的流程
29.多文件输出类
30.left join 和right的区别
31.hive数据清洗出现的原因
32.hive的特点
33.分区的目的
34.hive的加载数据的方式
35.hive代替in查询的方式
36.textfile和SequenceFile的区别
37. 静态分区和动态分区的区别
38.order by
39.空在hive里是如何存储的
40.hive支持哪些数据操作
41.如何自定义存储格式
42.hive的运行机制
43.hive的缺点
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值