![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
面试题整理
文章平均质量分 83
以实战为前提,将面试中常见问题刨析给大家
波波菜鸟
这个作者很懒,什么都没留下…
展开
-
【社招】快手_数据仓库_面试题整理
一、面试的是大数据开发岗(偏数据仓库),以下是面试题。技术面一共三面,我将问题hui1 讲一下你门公司的大数据项目架构2 你在工作中都负责哪一部分3 spark提交一个程序的整体执行流程。(包括向yarn申请资源,DAG切割,TaskScheduler,执行task等等过程,要说清楚)4 spark常用算子列几个,6到8个吧5 transformation跟action算子有啥区别6 map和flatmap的区别7 自定义usf,udtf,udaf讲一下这几个函数的区别,都要实现里面的什么方原创 2020-07-06 19:45:01 · 7452 阅读 · 17 评论 -
【hive】经典笔试面试题(四)如何计算分钟级DAU
1 需求还是那句老话,当需求描述清楚时,此需求就算完成了一半(大概是这个意思哈)啥是DAU?啥是分钟级DAU?咱们一个一个来DAU(Daily Active User)日活跃用户数量分钟级DAU,emmm 也不知道是不是这个叫法就是截止到当天分钟,累计到访过app的用户。比如 截至当天00:01分,到访用户20人截至当天00:05分,到访用户100人截至当天00:06分,到访用户105人……截至当天23:59分,到访用户10w人(也就是当天DAU)这个例子够鲜明了吧。应该可以理解了原创 2021-01-23 19:28:59 · 646 阅读 · 0 评论 -
【hive】经典笔试面试题(三)如何计算一个视频近30天的曝光量
1需求:工作中经常遇到需求不清晰,不仅仅我们做需求的开发同学搞不清楚想要什么,甚至连给我们提需求的产品经理也是一脸懵逼。对于做开发的同学来说,如果一个需求能描述清晰,逻辑严谨,那么这个需求相当于已经完成了一半了。老规矩,还是描述一下此次遇到的问题再谈如何解决。又一个直播间,...原创 2021-01-23 13:47:01 · 1409 阅读 · 0 评论 -
【hive】经典笔试面试题(二)连续登录天数最大
问题描述在数据仓库中存在这样一张表,记录了2019年用户在哪天登录了我司的网站或者app也行(总之就是登录啦)数据如下:表名:test2字段:id string,pday string需求:统计用户在本年中连续登录天数最大是几天?如:用户A在7月1、2、3、4日连续登录了4天;6、7、8日连续3天;11、12连续2天。用户A的当年最大连续登录天数是4天用户B在6月29日,6月30...原创 2019-12-13 19:48:57 · 1569 阅读 · 9 评论 -
【hive】经典笔试面试题(一)累加计算
问题描述在数据仓库中有这样一张表,记录了每个月的营业额,数据如下:test表:需要统计截止到每个月份的营业总额,如:截止到2019年1月份营业总额为10元截止到2019年2月份营业总额为10+10=20元截止到2019年3月份营业总额为10+10+10=30元以此类推…方案 一直接使用where条件过滤符合的数据,使用sum函数进行计算select sum(money) fr...原创 2019-12-11 20:34:04 · 1921 阅读 · 0 评论