记录23届非常坎坷的找暑期实习之旅,应用统计菜鸡前后投递50+公司的面试进展
字节二面挂
阿里二面挂
网易一面挂
美团一面挂
联想一面挂
腾讯一面挂
oppo oc
货拉拉 oc
特斯拉二面挂
滴滴二面鸽了
快手一面挂
婚礼纪 二面鸽了
安恒信息 二面挂
tplink 三面挂
华为 oc
上面是参加过面试的,排面试的公司其实相对我投简历的公司比例较少了,有一堆简历挂(哔哩哔哩,深信服。。。),笔试挂(得物,广联达。。。),或者好多投递完(小米,思谋科技,顺丰,爱奇艺,小红书。。。)没消息的没有统计
主要投递的岗有推荐搜索,机器学习,技术向的数分,数据挖掘
面试常问的一些问题主要还是从每个人的简历入手,上面涉及到什么模型,或者自己写了什么技能,会追着问一些,直接汇总每家问了什么
面试常问
- 自我介绍
- 英语自我介绍,你遇到过的困难(特斯拉)
- 项目介绍,你在项目中的角色,负责的内容
- 你学过的课介绍一下
- 用什么计算机语言
- 成绩(tp-link)
- 为什么本科在哈尔滨,研究生来武汉
- 你对我们公司的了解,公司里有认识的人么
- 未来的职业规划
- 期望薪资
- 估计浙江有多少车(费米估算问题)
- 做过的项目如果再做一遍,会改进什么
- 怎么评估你模型的好坏,怎么教业务人员用你的模型
- 为什么用某个模型
- 你的优缺点
- 数据处理做了哪些工作
- 特征编码
- 多重共线性对模型的影响,是对所有模型都有影响么
- l1,l2正则
- attention机制了解么
- rnn,lstm,gru介绍一下,区别
- 梯度消失,梯度爆炸,怎么解决
- 激活函数介绍
- 优化器了解么
- 批归一化懂么
- dropout是前向传播还是反向传播时候起作用的
- 模型过拟合怎么解决
- 类别不均衡怎么解决(数据,模型,评价指标)
- 评价指标,recall,precision,roc,auc,分类模型为什么用roc,不用recall
- 用的什么可视化工具(面了某家数分问的)
- bagging和boosting的区别
- 介绍下xgboost
- 介绍下lightgbm,lightgbm怎么处理数据缺失
- 欠采样,过采样,他们适用的场合
- ID3,C4.5,CART如何计算特征重要性
- 什么是熵
- SVM核函数,适用场合
- 因为我写了时序的比赛,碰到过对时序感兴趣面试官,问了时序的特征工程,奇异谱分析是什么,时序分解的方法,为什么用深度学习的模型不用传统模型,了解前沿的时序模型么
- 损失函数说一下,交叉熵损失,hinge损失
- 灰度关联分析(因为我的数学建模用了这个)
- 分布式计算框架是什么,为什么采取分布式计算(tp-link)
- 介绍分类模型,和他们适用场合
- k折交叉验证
- stacking模型融合
- LR原理
- 最大似然原理
- 随机过程学什么了,统计计算学什么了
- EM算法
- kmean每次结果一样么,质心怎么初始化
手撕代码
- 顺时针打印矩阵
- 计算器(字节)
- 二叉树层序遍历(考了两遍,忘了哪家)
- 矩阵最大正方形
- 岛屿个数
- 二叉树里有无和为target的两个数(快手数分)
- 冒泡排序
- 最长公共子串
- 最长无重复子字符
- python写个混淆矩阵的函数(美团商业分析)
- sql考一些窗口函数,dense_rank(),row_number(),rank()的区别,累计求和