大数据面试3分钟自我介绍_快手大数据岗位招聘面试题分享

本文分享了快手大数据面试经历,包括一面和二面的题目,涉及Flink的aggregate与process区别、UDF/UDTF实现、Flume事务、SQL查询及数仓设计等。面试还涵盖了手撕SQL、Flink设计、HBase与Redis场景应用、Druid系统理解等技术问题,以及职业规划讨论。
摘要由CSDN通过智能技术生成

快手面试题

学长1

快手:视频面试

1)一面:50分钟

(1)介绍项目

(2)Flink为什么用aggregate()不用process()

(3)自定义UDF,UDTF实现步骤,有哪些方法?UDTF中的ObjectInspector了解吗?

(4)Flume丢不丢数据?PUT,TAKE事务

(5)SQL题:

1. id department salary manager_id 找出员工薪水比领导薪水高的人员(单表join)

2. student course score 找出哪些学生课程比平均课程成绩高?(记不太清了,用到子查询)

(6)快手的数仓分了3层,OLAP用的是Druid,数据量每天达到PB级,上千个指标,平均每个人跑几百个指标吧。

2)二面:1小时

(1)手撕SQL

①A-天极增量表: uid,module_name,location,date

目标-B全量表: uid,module_name,first_entry_date,first_location

找出两个第一次插入到B表

②user:uid,age,date

order:order_id,order_money,location,date,其中location:{"city","xx"}

双十一场景,找出北京市双十一年龄范围在20-25岁的人中 的人数,人均销售额大于1000的人

④找出一个List中的最大值和最小值并返回

(2)问到了几个场景题

①Flink设计题

②HBase使用场景

③Redis使用场景

④Druid的一些东西

(3)最后问到了职业规划,闲聊

学长2

1)技术

(1)自我介绍

(2)问了下离线数仓的架构

(3)问了Hive四层架构

(4)问了业务系统8张表的更新方式

2)场景题:

(1)使用SQL或者SparkRdd写出代码

(2)两张表,怎么使用SparkRDD的方式实现Join,代码

Table1

uid,dept_id

Table2

dept_id,dept_name

(3)使用MR或者Spark实现countDistinct(例如求uid数量)

文章来源:尚硅谷大数据培训

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值