岗位:百度推荐春招实习,前两面间隔一周左右,二面结束后大概过了三周才通知安排三面,期间一度以为自己挂掉了…感觉面试期间被问到的问题有很多需要自己细细思考及好好掌握的地方,所以总结了一篇柳暗花明经。
一面(1.5h)
问答部分
- 介绍下实习经历和召回上所做的主要工作?
- 召回策略分别都做了哪些优化?
- 召回模型分别都做了哪些优化?特征+模型结构?
- 针对历史点击等用户行为,有没有做过模型上的优化?
- 召回侧所关注的主要指标是什么?如何判断召回策略是否有效 or 生效?
- 为什么在尝试了FFM之后要直接尝试DeepFM?有试过其他方法吗?
- 基于FFM做近邻索引和用DeepFM的区别是什么?
- DeepFM为什么会导致线上时延提高?有没有什么优化办法?模型+策略?
- MultiTask学习的互动目标主要包括什么?有没有想过在召回侧进行多目标学习?
- DeepFM+MMoE的模型结构是怎样的?相比Share-button主要提升在哪里?
- 学习多目标怎么保证融合各个目标的loss?存在哪些问题?正负样本怎么选取?
- 对于不同数量级的loss如何调整?如何兼顾分类任务和回归任务?
- EsMM结构是怎么实现的?正负样本是怎么选取的?EsMM存在样本不均衡问题,有什么更好的解决办法吗?
- 多个目标是如何融合在一起的?加法和乘法的区别?参数是怎么调整的?
- 精排中的Attention结构是怎么实现的?你们业务上的DIN结构做了哪些改进?
- 模型训练的方式是什么样子的?有没有接触过分布式的相关内容,Spark or flink?
- 大概讲讲毕设的实现,数据集,模型结构,loss指标。
- Python中的GIL机制?对哪种形式的任务影响较大?
- py2和py3的区别是什么?
算法部分
- 给定一个无序数组,求两数之和小于target的所有组合数.
# 双指针
def findThePaire(nums, target):
order = 0
nums.sort()
left,right = 0