问题1:自我介绍
问题2:聊项目1—精排模型
1. lightgbm特征筛选
lightgbm的特征重要性是怎么计算的?
节点的增益怎么计算的?
节点的值怎么计算的?
特征的类型有哪些?——数值型和类别型
数值型和类别型在计算特征重要性时候有差别吗?
2. 原始特征构建遵循的什么逻辑?
3. 筛选出来的特征在你的任务情境下比较重要?
4. deepfm如何与lightgbm线下做对比比较效果?离线评估模型效果怎么评价?
5. 简单介绍粗排的蒸馏模型?
- 粗排用DNN模型,线上是否能够扛得住?DeepFM和DNN之间的打分时间差的很多吗?
- 业内粗排使用什么模型?你为什么用DNN呢?
- 蒸馏的思想?hard loss和soft loss
- 知识蒸馏的这两个loss是想达到什么目的?背后的思想?
- 粗排的功能,自己的理解?
6. 数学建模
- 你做数学建模一般承担的角色?
- 其余没有细问?
7.SQL和tensorflow的问题
- 上一段实习经常使用SQL吗?
- tensorflow使用的版本?
- 你对tensorflow熟吗?模型是自己搭建的还是有现成的框架可以使用?
8. 精排模型
- 精排模型的迭代主要是哪几个方面?不要说细节,说主要额发展方向?eg:LR-FM解决了什么问题?
- 精排模型的收益点主要有哪些?怎么提高效果?
9.反问环节
- 组内推荐算法的主要业务方向?
- 对我的面试的点评以及对实习生的要求?
- 实习生能否接触到线上?