1.自我介绍
2.具体问项目流程,如项目怎么实现的
3.印象最深的问题,怎么发现的,怎么解决的?
4.spark用过吗,用到的开发工具
5.数据量多少,服务器台数
6.数仓每层做了什么事,为什么这样做?
笔试题:hive-sql
-
一个表tbl: c_id u_id score
用SQL计算每个班级top5学生的平均分 -
表A (uid,bid) ,
uid代表:用户id
bid代表:uid关注的用户id
表数据示例:
uid bid
1 2
2 1
1 3
3. 一个表tbl,有2个字段,uid,login_time。求uid对应的最大的连续登录天数
然后面试官还会就你说的细节进行提问,不过没什么难度。
我最后一题做错了,面试官还会就问题进行指导,很感谢他。