年前,技术群组织了一场数据类的技术&面试讨论会,邀请了一些大厂同学和23年参加招聘的同学来分享:新人如何入门数据和算法岗,面经/面试题分享、大厂在算法场景的落地项目及经验分享等热门话题。
今天分享一位星球成员的上岸之旅,最终成功拿下快手数据挖掘岗。 希望对后续找工作的有所帮助。如果你想加入我们的讨论群或者希望要更详细的资料,文末加入。喜欢本文记得收藏、关注、点赞 。
现在距离秋招结束也好长一段时间了,今天总结一下自己在秋招中的一些经验和教训,希望可以帮助到学弟学妹们。
先介绍一下我自己的情况,我本科211,硕士985。我投的都是数据挖掘岗,最后有幸拿到了快手的Offer。
顺丰
岗位:数据挖掘
-
深挖简历
-
ML主要是比较几个模型,Kmeans & DBSCAN分别应用在哪些场景比较好?LR & SVM的区别?分别应用在那些场景?
-
DL简单介绍一下RNN,它和 LSTM,ARIMA 的区别?
-
是否了解大数据?说说你了解的hadoop和spark。
-
sql题,涉及窗口函数
-
有没有做过参加过比赛?我说美赛,简要说明了一下。
-
我反问我应该加强什么?
招联金融
岗位:数据挖掘
一面
-
项目介绍
-
特征选择方法
-
数据挖掘中对于缺失值的处理方案
-
说一下 Python(pandas)中常用的数据处理算子。
-
Spark 的原理,分布式是怎么搭建的。
-
Sql中 union 和 union all 的区别
-
数据行转列怎么操作
-
xgboost和gbdt的区别
-
xgboost常调的参数有哪些
-
svm原理
-
说一下你在研会组织了什么活动?
-
讲一下你支教的经历。
-
反问
二面
-
自我介绍
-
项目竞赛深挖
-
说一下你风控项目中用到的模型?
-
数据挖掘中缺失值和异常值是怎么处理的?
-
特征降维怎么做?
-
Sql用过哪些操作,举个例子
-
Sql如何提高运行效率?
-
过拟合的处理方法?
-
项目中遇到困难如何解决?
-
领导交给你一项不可能完成而且又很重要的问题,怎么办?
-
反问
联想
岗位:数据挖掘
时间过去有点久了,纯凭回忆,可能有些遗漏
一面
-
机器学习基础知识
-
Bagging & Boosting
-
常用的聚类算法
-
Kmeans和DBSCAN的原理和区别
-
逻辑回归的原理
-
怎么处理离散数据
-
支持向量机原理
-
SVM怎么处理非线性
-
常用的回归模型
-
Attention 原理
-
RNN和LSTM的区别
-
什么是梯度爆炸/梯度消失,什么情况下会出现
-
梯度渐进的原理
-
手撕算法:判断是否是回文、找出最长回文子串
蓝月亮
岗位:数据挖掘
专业面试
-
开头问问过往的经历,讲一下过往的一个项目,没有深挖
-
线性回归和逻辑回归有什么区别
-
逻辑回归的形式是什么,损失函数是什么
-
线性回归的损失函数是什么
-
逻辑回归的激活函数是什么,除了sigmoid还知道哪些
-
为什么有的时候需要将连续变量离散化
-
怎么将连续的变量离散化
-
决策树的特征选择原理有哪些
-
过拟合和欠拟合怎么理解,分别怎么解决
-
SVM 的原理
-
SVM如何解决线性不可分的问题
-
既然你提到了惩罚系数,那么讲讲SVM使用的核函数有哪些
-
xgboost和GBDT的区别
-
提到了正则项,那么L1和L2有什么区别
-
xgboost泰勒展开是一阶还是二阶
-
多线程和多进程
-
用过哪些编程语言
-
反问:介绍了团队的主要岗位,一些日常工作,业务范围
主管面试
这一轮不太问专业问题,主要从职业发展,个人成长,个人意向去问
比如:作为技术岗,怎么提高自己的业务能力,你会通过什么方式进行技术的学习
比较感动的是没有考手撕代码,除了SQL以外的手撕代码我都非常头大,感觉他们IT需求蛮多的,算法、NLP、CV都需要,可以试试~
快手
岗位:数据挖掘
一面
-
自我介绍
-
项目介绍
-
项目细节
-
随机森林、决策树、XGBoost的区别和联系
-
离散特征怎么处理?(没听懂面试官想问啥 )
-
针对项目提问,连续特征怎么处理?
-
算法:最大子序和 动态规划+贪心算法 做题有点慢
面试官建议:虽然有些东西工作不会用到,但是面试还是会问,题还是应该多刷一刷 不说了,刷题背八股去了。
二面
-
自我介绍
-
项目介绍(What、Why、How、难点、思考)
-
项目怎么分工的
-
一两句话简述LR、随机森林、XGBoost优缺点
-
精准率、召回率、F1-score、AUC指标的含义和使用场景
-
二维矩阵查找【二分法】
不记得还有什么了。。。
三面
-
自我介绍
-
项目介绍
-
线性回归,模型的假设,损失函数,求解
-
BP神经网络。反向传播传的是什么?
-
各种分桶方法的优缺点
-
特征组合,归一化
-
深度学习与传统机器学习相比最大的不同?
技术交流
独学而无优则孤陋而寡闻,技术要学会交流、分享,不建议闭门造车。
建立了技术交流与面试交流群,面试真题、答案获取,均可加交流群获取,群友已超过2000人,添加时最好的备注方式为:来源+兴趣方向,方便找到志同道合的朋友。
方式①、微信搜索公众号:Python学习与数据挖掘,后台回复:交流
方式②、添加微信号:dkl88194,备注:交流
文章精选
- 滴滴风控机器学习算法岗面试题8道(含答案解析)
- 美团营销机器学习算法岗(实习)面试题9道(含答案解析)
- 面了滴滴的数据分析师(实习),几道面试题都是原题啊
- 面试必备!机器学习常用十大算法的优缺点!
- 25道机器学习面试问题(附答案)
- 5个必考的大厂SQL面试题
- 一文解决样本不均衡
- 10 大经典排序算法 Python 版实现
- 实战案例:时间序列预测代码模板(单变量、多元、多步、多元多步)
- 实战案例:基于fasttext embedding + lightgbm 垃圾短信识别
- 实战案例:构建基于 DSSM 双塔模型的电影推荐系统
- 实战案例:构建基于 Transformer 建立时间序列预测模型(附完整代码)
- 实战案例:基于LSTM的四种方法进行电影评论情感分类预测
- 实战案例:基于LSTM的国际航空公司乘客预测
- 实战案例:基于电商销售数据的 RFM 模型构建
- 实战案例:一文详解数据分析经典模型RFM
- 实战案例:基于孤立森林的信用卡欺诈检测