作者 | 无尽の等待
整理 | NewBeeNLP
七月中旬投递百度提前批,7.29一面,7.30通知8.2日二面,8月4日三面,当场就给了oc。面试官说测评做完就等hr意向书了。百度效率这么高也是很惊讶,而且每一轮面试和面试官的交流都很开心,好感度upup
背景是:985本,海硕,不是科班出身,本科一个一作,一段6个月的实习,做的是NLP相关的。
一面 1h
是一个小姐姐,推荐策略部的。电话面试+屏幕共享IDE
自我介绍
看你简历上写了一个推荐的项目,说一说这个项目吧
模型的输入是哪些特征,为什么用这些特征?
看你是做NLP相关的,word2vec肯定了解吧?说一说word2vec(八股文类型,顺便把两个优化原理给说了)
简要介绍一下实习的项目。
做题环节 跳跃游戏+follow up,非递归实现中序遍历
了解hadoop吗?(以前疫情期间还真玩过一段时间,后面聊了聊map reduce和hdfs)
你实习的项目用到了分布式训练吗?(没有,实习生没这待遇)
C++基础:vector的底层实现了解吗?是不是连续的存储空间?push_back和emplace_back有什么区别?map和unordered_map的底层实现是什么?
最后聊了聊目前实习项目遇到的问题。
反问 小姐姐当场就说明天会有人联系二面。
二面 1h30min
视频面+屏幕共享IDE,是一个很厉害的小哥。只不过我主要做NLP,面试面了很多推荐算法细节。
自我介绍
详细介绍一下你的实习项目吧。(等于做了一个pre,讲了大约25min,把所以项目问题+细节+解决方法+优化思路介绍了一下,有共享IDE的好处还可以收到公式推导)
看你简历上写了一个推荐项目,介绍一下这个项目吧。(又是10分钟左右)
推荐用的指标是什么?(AUC和nDCG),介绍一下这两个指标吧(手推计算公式)
AUC对正负样本敏感吗?你前面提到了负采样,那要是对推荐的线下样本进行采样对AUC的影响是什么?(注意要分类讨论,小哥还和我一起分析了一下,纠正了我的小错误,只不过感觉我提到了要分类讨论估计也是他要的答案)
你在项目中怎么融入类别和数值型特征的?
看你用了deep&cross,简单介绍一下吧。
要是输入特征特别多,你会选择用什么方法选择合适的特征输入模型?(算是八股文了)
知道LR的吧?它是线性还是非线性的模型?(我这儿还提到是在不进行特征交叉的前提下是线性的,他就又问了我你了不了解FM。简单说了一下,时间关系没详细问)
LR的权重值的意义是什么?
做题:降序二维矩阵,问target存不存在,一开始傻傻用了二分,后来面试官提示了一下观察右上角的数总算把复杂度降到了O(m+n) 两个file,一个file存的是关键词,另一个file存的是包含关键词的多行语句,要求找出每句话中在file1中存在的关键词(假定一定存在),说思路就行。
你平时python和C++用得多吗?各问一个基础题吧。(1)vector的底层实现,动态数组实现的原理,万一你有个指针指向vector第二个slot的地址,然后你push_back了100个元素,分析一下这个指针指向了什么东西?(一开始答错了,我说这个我不太了解,但是后面通过底层分析说了正解,打了刚刚回答的脸) (2) python中return和yield有了解吗?说一下区别。
反问 小哥技术很强,介绍项目的时候也有互动。我对推荐算法了解不是特别深入,他也会耐心的引导我去分析问题。第二天以为会凉,只不过晚上8点左右约了4号下午的三面,是主管面。
三面 40min
自我介绍。
项目介绍,项目中遇到了什么问题?(介绍了一下问题,解决思路,和现在还存在的问题)
聊一下以后的规划和打算吧。
你对未来的自己有什么期望?想要达到什么样的高度?
后面和他聊了一下对我做过的项目和发的论文的复盘以及思考。
平时有什么兴趣爱好?
为什么选择现在的实习公司?有转正机会为什么不留下?
聊了一下薪资和发展前景的balance问题,和我安利了百度的培养体系。
反问 当场就和我说之后会给我发个测评,然后会有hr联系,之前两个面试官和他自己都觉得我还不错,就口头给pass了,但是测评别乱填。还加了微信。
总的来说面试感觉和别的公司和不一样,把展示的机会交给面试者自己。事后复盘的时候我觉得presentation的时候逻辑+细节+原理都很重要,我感觉自己的coding能力其实没那么强,但是可能项目介绍环节很加分吧。