秋招第十弹:字节跳动二面-大数据开发工程师(电商)
写在最前:秋招以来一直在冲,因为事情比较多,对于笔试面试一直没有复盘,现在靠仅存的记忆把面试的一些问题记录下来,尽可能记录出能回忆到的问题,但可能记的不是很全。
时长:50min
-
自我介绍
-
开始死问项目,问的很细,怎么做的?为什么这么做?现在觉得有没有不妥的地方?有没有需要改进的?主题域为什么这样设计?分层模型怎么做的?任务怎么调优的?
差不多问了我快半个小时,加上我的网络有点不好,总出现中断
-
维度建模了解多少?星型模型和雪花模型的区别?哪个模型用的比较多?
-
压缩格式知道多少?压缩性能怎么样?这几种压缩格式做过对比吗?
好在平时我没事时候专门对压缩格式做过一些对比,对压缩速度、解压速度、压缩比有一定的了解,虽然具体数据记不住了,但是优劣还是有印象的,不然大写尴尬
-
数据集市知道吗?数据集市和数仓有什么不一样?
-
拉链表知道吗?
拉链表我是相当熟悉了,虽然真实没有用过,但是这些理论我是非常的清楚,仔细的讲解了我对拉链表的理解,以及在使用过程中的优劣
-
拉链表怎么查询某一天的数据?
给一个拉链表,让我写出来查询某一天的数据的sql,开始说的比较乱,想着蒙混过关,没想到面试官很仔细的在考虑我的语句,让我仔细解释解释,我只能重新的仔细写一个,面试官才满意
-
spark的参数知道多少?平时做的调优?
-
数据倾斜怎么处理的?怎么发现的数据倾斜?为什么会有热点问题?
-
给了一个场景,让设计事实表以及维度和指标
-
给了一个case,大概是指标出现了错误,问怎么快速定位问题?
-
任务告警怎么做的?数据质量该怎么保证?
-
对数据治理有什么了解?怎么才能做好数据治理?
-
算法题:一个数组,每个位置的数据代表了可以跳跃的格数,求最少跳跃几次可以到达最后?
动态规划问题,今年的秋招算法题,除了动态规划,就是动态规划了
-
sql题:连续登录问题
今年的sql题,除了连续登录问题,就是连续登录问题了
-
开窗函数中不同参数的区别?开窗函数和聚合函数有什么区别?
在这里我找到一个诀窍,能写代码的,尽量写代码,因为写代码比着口述,第一是可以让面试官融入自己的情感,知道你的处理逻辑,第二就是写代码就表现的很自信,因为大家都是尽量少些,而你主动去写,反向面试,惊呆面试官。当然了,你得保证写的正确才行
-
反问
总结:二面的面试官有点老板风范,过程中不知道是在干其他事情,还是在记录我的面试情况,有时候会眼神在屏幕扫荡,面试问题比较针对于真实生产环境,对于没有实习经验的小伙伴可能不太友好,而且对项目问的也比较全面,一大半的时间都在问项目,总之,整体来说难度和体验都还可以。