今年冬天冷的好慢,现在空气中吹的风还是暖的...
京东大数据面试题
_ | hive中都有哪些join操作?
|
_ | 数仓分层,主要负责哪些任务? |
_ | 有没有遇到过数据倾斜,怎么处理数据倾斜的? |
_ | HashMap和HashTable区别? |
_ | sql题:某网站每天有很多人登陆,请你统计一下该应用每个用户最近登陆是哪一天,用的什么设备, 一个登陆(user_login)表:
一个用户表(user)
一个客户端表(client)
最终输出字段: 用户名 日期 设备名 微信公众号:OnlyCoding |
_ | 统计新登录用户的次日留存 一个登陆(user_login)表:
|
_ | 算法:给定一颗二叉树,按照从顶部到底部的顺序,返回从右侧能看到的节点值? 输入:[1,2,3,null,5,null,4] 输出:[1,3,4] |
_ | hive分区和分桶区别? |
_ | hive分桶表的作用? |
_ | 两个表join过程中,空值的情况如何处理? |
_ | hive存储结构的区别? |
_ | hive本身对于sql做了哪些优化? |
_ | flink retrict/append |
_ | sql题:
要求:
|
_ | _ |