大数据面试3分钟自我介绍_快手大数据岗位招聘面试题分享

最新推荐文章于 2024-05-14 10:06:57 发布

weixin_39611769

最新推荐文章于 2024-05-14 10:06:57 发布

阅读量383

点赞数

文章标签：大数据面试3分钟自我介绍

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39611769/article/details/112834369

版权

本文分享了快手大数据面试经历，包括一面和二面的题目，涉及Flink的aggregate与process区别、UDF/UDTF实现、Flume事务、SQL查询及数仓设计等。面试还涵盖了手撕SQL、Flink设计、HBase与Redis场景应用、Druid系统理解等技术问题，以及职业规划讨论。

摘要由CSDN通过智能技术生成

快手面试题

学长1

快手：视频面试

1)一面:50分钟

(1)介绍项目

(2)Flink为什么用aggregate()不用process()

(3)自定义UDF,UDTF实现步骤，有哪些方法？UDTF中的ObjectInspector了解吗？

(4)Flume丢不丢数据？PUT,TAKE事务

(5)SQL题:

1. id department salary manager_id 找出员工薪水比领导薪水高的人员(单表join)

2. student course score 找出哪些学生课程比平均课程成绩高？(记不太清了，用到子查询)

(6)快手的数仓分了3层，OLAP用的是Druid,数据量每天达到PB级，上千个指标，平均每个人跑几百个指标吧。

2)二面：1小时

(1)手撕SQL

①A-天极增量表： uid,module_name,location,date

目标-B全量表： uid,module_name,first_entry_date,first_location

找出两个第一次插入到B表

②user:uid,age,date

order:order_id,order_money,location,date，其中location:{"city","xx"}

双十一场景，找出北京市双十一年龄范围在20-25岁的人中的人数，人均销售额大于1000的人

④找出一个List中的最大值和最小值并返回

(2)问到了几个场景题

①Flink设计题

②HBase使用场景

③Redis使用场景

④Druid的一些东西

(3)最后问到了职业规划，闲聊

学长2

1)技术

(1)自我介绍

(2)问了下离线数仓的架构

(3)问了Hive四层架构

(4)问了业务系统8张表的更新方式

2)场景题：

(1)使用SQL或者SparkRdd写出代码

(2)两张表，怎么使用SparkRDD的方式实现Join，代码

Table1

uid，dept_id

Table2

dept_id,dept_name

(3)使用MR或者Spark实现countDistinct(例如求uid数量)

文章来源：尚硅谷大数据培训

weixin_39611769

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。