美团点评面试经历,面试地点:武汉,面试岗位:机器学习/数据挖掘工程师。
总共有4面,3轮技术面+1轮HR面,我跪在了三面。以下是每一面提出的一些问题,我只写了自己能回忆起来的一部分问题:
一面
1、编程题:给定一个int数组,在数组中取J个连续的数,求着J个数能组成的最大的和是多少?其中这J个数两两之间的索引间隔最大可以为K,当K=1时表示数字之间必须连续。
例:给定数组{1,2,3,4,5,6,8,7,9,10},当J=3,K=1时,结果是选取(7,9,10)三个数,最大和为26。而当J=3,K=2时,结果是选取(8,9,10)这三个数,最大和为27,这里数字8和9的索引间隔为2。
2、GBDT跟普通决策树的区别在哪里?(我的疑问:GBDT是用了Boosting的思想吗?)
3、AUC和ROC曲线的概念?如何绘制?他们与查准率和查全率相比的优点是什么?
4、除了AUC和ROC,还了解什么其它的推荐系统的评价指标?比如说MAP?
5、如何识别标题党类的低质量文章?
二面
1、编程题:给定一个int数组,要求将能被3整除的所有数字排列在数组左侧,其它所有数字排在数组右侧(不用管数字的大小顺序),要求空间复杂度是O(1)。
2、对于标称值类的特征,应该如何处理?(独热编码)为什么一定要这样处理?
3、为什么集成学习的泛化能力强?为什么多个基分类器融合之后的泛化能力会提升?
三面
1、有没有阅读过xgboost的源码?
2、BiGRU+Attention的原理?
3、Word2Vec中,CBOW训练词向量时神经网络的loss是什么?