一面(大约1个小时):
- 自我介绍
- 项目(项目问了特别久,因为我项目里用到了spark gbdt,所以让我讲一下gbdt的原因,问我的数据集多大,树怎么调参的等等引申问题
- hive sql统计昨天访问过的用户并且今天没有访问的用户
算法题
输入点对: A B C D H I B G H J 输出: A B G C D H I J 类似这样的对,实现合并
二面(大约1个小时)
- 自我介绍
- 算法题:LeetCode#64原题 我用二维数组DP写出来了 面试官的follow up 如何优化空间复杂度即用o(n)实现
- 100w个数,如何找出前K大的数 (我一开始回答利用集群来处理,后面面试官想听到的其实是堆排序和快排来实现)
- 聊项目
- 推导LR
- LR怎么防止过拟合
- L1和L2(L1和L2是什么,为什么L1能产生稀疏解)
- 线性相关特征对LR和GBDT训练结果会有影响?
- 概率题:从1-M这M个数中有放回的随机抽取K次,求最大值的期望(这个题目一开始我没有get到题意)M的k次幂-(M-1)的K次幂,再除以M的k次幂
大概记得的就这些内容了,二面面试官看起来很强
微博实习生面试记录
最新推荐文章于 2022-07-13 13:45:43 发布