平安产险-大数据开发面经

最新推荐文章于 2022-04-13 00:17:04 发布

qiyong7578

最新推荐文章于 2022-04-13 00:17:04 发布

阅读量757

点赞数

分类专栏：面经

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qiyong7578/article/details/112550010

版权

面经专栏收录该内容

5 篇文章 0 订阅

订阅专栏

1、hive接触过哪些文件存储类型，text的优劣、列式存储的好处、SequeceFile的好处、RCFile有没有用过
https://www.cnblogs.com/jiejiaobuleng/p/12906354.html
https://blog.csdn.net/qq_33813365/article/details/82864241

2、对mr的理解
3、内部表和外部表的区别，对应的应用场景
4、map join和reduce join的区别
5、写过最复杂的sql，场景是什么，工作中什么样的sql写的比较多
6、hive的数据倾斜，怎么解决
*
7、宽依赖和窄依赖的理解*
shuffle、stage，发生shuffle就会划分stage，产生宽依赖

8、日志数据、交易数据的数据量
9、数仓的理解，我从分层角度回答、元数据管理
10、数据治理，怎么监控数据是否跑错

11、对项目的理解，项目经历的职责

二面

1、Kafka的数据通知方式
2、Kafka的数据消费方式
3、hive的优化
4、hive几种join
5、hive算子、hive转换成mr的过程
6、map-join讲一讲
7、两张大表，join的key是有序的，怎么优化
8、数据如何拉通？设计上要注意哪些？
9、数据架构如何设计？数仓分层
10、拉链表是什么，解决了些什么问题，用来解决什么，应用场景

关注

0
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
平安产险-大数据开发面经

1、hive接触过哪些文件存储类型，text的优劣、列式存储的好处、SequeceFile的好处、RCFile有没有用过2、对mr的理解3、内部表和外部表的区别，对应的应用场景4、map join和reduce join的区别5、写过最复杂的sql，场景是什么，工作中什么样的sql写的比较多6、hive的数据倾斜，怎么解决*7、宽依赖和窄依赖的理解*shuffle、stage，发生shuffle就会划分stage，产生宽依赖8、日志数据、交易数据的数据量9、数仓的理解，我从分层角度回答、
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。