一面
- 自我介绍
- 聊项目
- 说一种你熟悉的模型
- 如何在一个大数据量的情况下 设计一个cache 比如用户搜索请求数据库 不反复从数据库里读
二面
- 自我介绍
- 聊项目
- GBDT的实现,xgboost的实现,两者的差别
- xgboost为什么要二阶泰勒展开
- 如何选取样本,正负样本不均匀的情况下怎么处理,为什么不均匀会不好
- 如何洗数据
- 特征的选择
- 如何选择模型
- 随机森林为什么可以防止过拟合
- 数据为什么要分片
- xgboost如何计算每个特征的重要程度
HR面
- 比赛经历
- 实习经历
- 薪资要求
- 岗位意向
- 面过哪些公司 有哪些offer
- 是否考虑落户上海
- 工作城市之间 你心中的排名是怎么样的
- 能否接受加班