面了几家大厂数据挖掘岗,题是一家比一家难。。。

年前,技术群组织了一场数据类的技术&面试讨论会,邀请了一些大厂同学和23年参加招聘的同学来分享:新人如何入门数据和算法岗,面经/面试题分享、大厂在算法场景的落地项目及经验分享等热门话题。

今天分享一位星球成员的上岸之旅,最终成功拿下快手数据挖掘岗。 希望对后续找工作的有所帮助。如果你想加入我们的讨论群或者希望要更详细的资料,文末加入。喜欢本文记得收藏、关注、点赞 。


现在距离秋招结束也好长一段时间了,今天总结一下自己在秋招中的一些经验和教训,希望可以帮助到学弟学妹们。

先介绍一下我自己的情况,我本科211,硕士985。我投的都是数据挖掘岗,最后有幸拿到了快手的Offer。

顺丰

岗位:数据挖掘

  1. 深挖简历

  2. ML主要是比较几个模型,Kmeans & DBSCAN分别应用在哪些场景比较好?LR & SVM的区别?分别应用在那些场景?

  3. DL简单介绍一下RNN,它和 LSTM,ARIMA 的区别?

  4. 是否了解大数据?说说你了解的hadoop和spark。

  5. sql题,涉及窗口函数

  6. 有没有做过参加过比赛?我说美赛,简要说明了一下。

  7. 我反问我应该加强什么?

招联金融

岗位:数据挖掘

一面

  1. 项目介绍

  2. 特征选择方法

  3. 数据挖掘中对于缺失值的处理方案

  4. 说一下 Python(pandas)中常用的数据处理算子。

  5. Spark 的原理,分布式是怎么搭建的。

  6. Sql中 union 和 union all 的区别

  7. 数据行转列怎么操作

  8. xgboost和gbdt的区别

  9. xgboost常调的参数有哪些

  10. svm原理

  11. 说一下你在研会组织了什么活动?

  12. 讲一下你支教的经历。

  13. 反问

二面

  1. 自我介绍

  2. 项目竞赛深挖

  3. 说一下你风控项目中用到的模型?

  4. 数据挖掘中缺失值和异常值是怎么处理的?

  5. 特征降维怎么做?

  6. Sql用过哪些操作,举个例子

  7. Sql如何提高运行效率?

  8. 过拟合的处理方法?

  9. 项目中遇到困难如何解决?

  10. 领导交给你一项不可能完成而且又很重要的问题,怎么办?

  11. 反问

联想

岗位:数据挖掘

时间过去有点久了,纯凭回忆,可能有些遗漏

一面

  1. 机器学习基础知识

  2. Bagging & Boosting

  3. 常用的聚类算法

  4. Kmeans和DBSCAN的原理和区别

  5. 逻辑回归的原理

  6. 怎么处理离散数据

  7. 支持向量机原理

  8. SVM怎么处理非线性

  9. 常用的回归模型

  10. Attention 原理

  11. RNN和LSTM的区别

  12. 什么是梯度爆炸/梯度消失,什么情况下会出现

  13. 梯度渐进的原理

  14. 手撕算法:判断是否是回文、找出最长回文子串

蓝月亮

岗位:数据挖掘

专业面试

  1. 开头问问过往的经历,讲一下过往的一个项目,没有深挖

  2. 线性回归和逻辑回归有什么区别

  3. 逻辑回归的形式是什么,损失函数是什么

  4. 线性回归的损失函数是什么

  5. 逻辑回归的激活函数是什么,除了sigmoid还知道哪些

  6. 为什么有的时候需要将连续变量离散化

  7. 怎么将连续的变量离散化

  8. 决策树的特征选择原理有哪些

  9. 过拟合和欠拟合怎么理解,分别怎么解决

  10. SVM 的原理

  11. SVM如何解决线性不可分的问题

  12. 既然你提到了惩罚系数,那么讲讲SVM使用的核函数有哪些

  13. xgboost和GBDT的区别

  14. 提到了正则项,那么L1和L2有什么区别

  15. xgboost泰勒展开是一阶还是二阶

  16. 多线程和多进程

  17. 用过哪些编程语言

  18. 反问:介绍了团队的主要岗位,一些日常工作,业务范围

主管面试

这一轮不太问专业问题,主要从职业发展,个人成长,个人意向去问

比如:作为技术岗,怎么提高自己的业务能力,你会通过什么方式进行技术的学习

比较感动的是没有考手撕代码,除了SQL以外的手撕代码我都非常头大,感觉他们IT需求蛮多的,算法、NLP、CV都需要,可以试试~

快手

岗位:数据挖掘

一面

  1. 自我介绍

  2. 项目介绍

  3. 项目细节

  4. 随机森林、决策树、XGBoost的区别和联系

  5. 离散特征怎么处理?(没听懂面试官想问啥 )

  6. 针对项目提问,连续特征怎么处理?

  7. 算法:最大子序和 动态规划+贪心算法 做题有点慢

面试官建议:虽然有些东西工作不会用到,但是面试还是会问,题还是应该多刷一刷 不说了,刷题背八股去了。

二面

  1. 自我介绍

  2. 项目介绍(What、Why、How、难点、思考)

  3. 项目怎么分工的

  4. 一两句话简述LR、随机森林、XGBoost优缺点

  5. 精准率、召回率、F1-score、AUC指标的含义和使用场景

  6. 二维矩阵查找【二分法】

不记得还有什么了。。。

三面

  1. 自我介绍

  2. 项目介绍

  3. 线性回归,模型的假设,损失函数,求解

  4. BP神经网络。反向传播传的是什么?

  5. 各种分桶方法的优缺点

  6. 特征组合,归一化

  7. 深度学习与传统机器学习相比最大的不同?

技术交流

独学而无优则孤陋而寡闻,技术要学会交流、分享,不建议闭门造车。

建立了技术交流与面试交流群,面试真题、答案获取,均可加交流群获取,群友已超过2000人,添加时最好的备注方式为:来源+兴趣方向,方便找到志同道合的朋友。

方式①、微信搜索公众号:Python学习与数据挖掘,后台回复:交流
方式②、添加微信号:dkl88194,备注:交流

文章精选

  • 25
    点赞
  • 27
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值