Hadoop（二）答辩题问题

最新推荐文章于 2023-11-11 18:11:21 发布

Yatpif

最新推荐文章于 2023-11-11 18:11:21 发布

阅读量839

点赞数

分类专栏： Hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Yatpif/article/details/79578903

版权

Hadoop 专栏收录该内容

10 篇文章 0 订阅

订阅专栏

1.什么是shuffle？shuffle的流程
2.hadoop调度器？
3.什么是etl？
4.hive的数据类型
5.分桶的理解
6.hive的四大器
7.hive的索引
8.hive元数据的三种存储方式
9.hadoop内置的输出文件的格式
10.hive元数据默认保存的位置
11.hive 的内置函数
12.hive的优化
13.如何理解分区
14.hive的存储格式
15.如何实现动态分区
16.hive最大的优点
17.hive中的数据倾斜
18.排序
19.内部表和外部表的区别
20.job和tast的区别
21.二次排序
22.mr的优化
23.如何创建一个udaf函数
24.hive和hadoop的关系
25.分区的意义
26.mr的应用场景
27.hive的架构
28.mr的流程
29.多文件输出类
30.left join 和right的区别
31.hive数据清洗出现的原因
32.hive的特点
33.分区的目的
34.hive的加载数据的方式
35.hive代替in查询的方式
36.textfile和SequenceFile的区别
37. 静态分区和动态分区的区别
38.order by
39.空在hive里是如何存储的
40.hive支持哪些数据操作
41.如何自定义存储格式
42.hive的运行机制
43.hive的缺点

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Hadoop（二）答辩题问题

1.什么是shuffle？shuffle的流程2.hadoop调度器？3.什么是etl？4.hive的数据类型5.分桶的理解6.hive的四大器7.hive的索引8.hive元数据的三种存储方式9.hadoop内置的输出文件的格式10.hive元数据默认保存的位置11.hive 的内置函数12.hive的优化13.如何理解分区14.hive的存储格式15.如何实现动态分区16.hive最大的优点1...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。