算法面经+春秋招总结(含BAT TM W等)
作者:泡了个泡
链接:https://www.nowcoder.com/discuss/127357
来源:牛客网
本人真·末流985软件工程本硕,研究方向推荐系统(但是整个实验室也只有我自己在研究),JCR1区水刊论文一篇,对于机器学习也算是半路出家,从今年一月份才开始系统的学习。
经历了惨痛的春招与秋招之后,也积攒了一些面经,希望能对大家有所帮助。
春招
360 浏览器事业部 推荐算法工程师
一面
1.项目
2.关键字怎么提取的,TF-IDF有改进么,怎么改进的
3.命名实体怎么得到的,原理了解
4.LDA的原理是什么,使用了哪个框架
5.狄利克雷分布能具体说说么
6.深度学习了解么
7.RNN LSTM了解么
8.有什么比较熟悉的算法
9.xgboost的原理
10.有10个排好序的数据库,那么我要找整个的中位数,怎么找
11.一个路口,一个小时通过一个车的概率是0.9,那么20分钟内通过车的概率是多少
12.我有一个32位的id是唯一的,那么我想压缩一下,让他还唯一,怎么压缩
二面
1.项目
2.SVM原始问题为什么要转化为对偶问题,为什么对偶问题就好求解,原始问题不能求解么
3.K-means 中我想聚成100类 结果发现只能聚成98类,为什么
4.进程中的内存分段是怎样的
5.每个线程有哪些东西是自己独享的
6.一枚不均匀的硬币,我抛了100次,有70次朝上,那么第101次朝上的概率是多少
这个概率怎么样,公示是如何推导出来的
7.给你个字符串,字符串是个数字,怎么转换为int型,不用库函数的话
8.4个海盗,100个金币,每个人轮流提方案,如果你的方案有半数以上通过,那么久可以,否则就会被杀掉,如果你是第一个人,那么你怎么提方案比较好
9.你的优点是什么
有些问题回答的不够好,面完二面以后HR让等通知,几天之后查状态果然挂了
*********************************************************************************************************************************************************************************
美团点评 到店综合 机器学习/数据挖掘工程师
一面
1.先聊了半天项目,从细节创新点,讲到了整体的架构。聊了大概15分钟左右。。
2.GBDT的原理,以及常用的调参的参数
3.xgboost的跟GBDT比优点都有哪些
4.一道SQL题,count(1),count(*),count(列名) 这三个有什么区别
然后问了下什么时候能来实习,实习多久
我问了他他这边都做什么,就这么愉快的结束了面试
二面
1.L1、L2正则化,区别
2.项目,长短期兴趣,如何验证,时间敏感
3.文本内容推荐中有哪些内容可以应用到商品团购推荐当中去
4.Xgboost中的行抽样,可以起到哪些作用
5.样本少了不是会过拟合么,为什么行抽样可以防止过拟合
6.算法题,一个数组,找出第k大的数
这些方法的时间复杂度是多少
二面过后过了三四天左右,收到了offercall
*********************************************************************************************************************************************************************************
腾讯IEG安全部门一面(提前批)
1.说一下构建模型的过程
2.特征选择方法都有哪些
3.常用的损失函数和适用场景
4.LR和SVM原理
5.LR和SVM这两个应用起来有什么不同
6.PCA说一下
7.你都会什么聚类方法
8.模型的评价方法有哪些
9.ROC怎么画
10.你知道SoftMax么
11.野指针是什么意思
12.快排的思想是什么
13.Linux中查找符合一定规则的文件名怎么查找,或者用脚本也行
14.C++会不会 虚函数是什么意思
15.我有一个文本,那么我要统计每个词出现的频率,Python上应该怎么做
16.编代码的时候如何申请内存,有哪些方法
17.你玩游戏么,都玩过哪些游戏
由于提前批被捞的时候距离提前批流程结束已经没几天了,所以没能完成后续面试
腾讯沈阳现场一面
1.项目
2.特征选择方法都有用过哪些
3.随机森林怎么进行特征选择
4.用过哪些机器学习算法
5.加密方法知道哪些
6.MD5可逆么
7.word2vec用过么
8.极大似然估计是什么意思
9.上过哪些课
10.排序算法哪些时间复杂度比较低
11.计算机网络了解多少
20分钟,问题除了加密的部分其他应该都答得还可以
然后出来之后被秒挂了
*********************************************************************************************************************************************************************************
阿里 新零售 天猫 算法工程师-机器学习
一面
先是一个简单的自我介绍;
1.然后介绍了项目的框架和主要创新点;
2.说一下随机森林和Adaboost,以及区别
3.说一下GBDT和Adaboost,以及区别
4.说一下LDA的原理
5.对于PCA,会有第一主成分、第二主成分,怎么为什么第一主成分是第一,原因是什么?
6.PCA的主成分是怎么得到的
二面
先是简单问了一些关于什么时候可以实习,学校这边的状况如何的问题。
然后开始聊项目,项目聊得比较细,我做了哪些创新点,具体怎么做的,有问题面试官都会追问清楚。
1.说一下SVM
2.聊了一下之前本科的实习经历
3.面向对象的三要素
4.对深度学习了解多少
5.你觉得深度学习的方法和传统机器学习比,有什么大的优势
二面通过了,之后流程也到了三面面试官的手里,但是好像p9大佬一直很忙没有时间面我,又赶上当时天猫周年庆。。。最后一直拖到流程结束,还是没有缘分啊
*********************************************************************************************************************************************************************************
GrowingIO 机器学习工程师
一面
1.项目
2.当我们要求准确率很高,但是不在意召回率的时候,可以怎样处理。
3.回归算法用于分类的阈值如何确定呢
4.xgboost,说一下原理,步长如何设定
二面
这次的二面问的问题都很open,都是一些如何让我的推荐系统可以更好的应用于大数据的实际场景当中去的问题。
首先是一个1分钟的简短的自我介绍。
还是聊项目,创新点,以及系统架构和实现。
1.k-means中的k如何确定呢?
2.除了k-means,还可以用什么聚类方法,或者你还熟悉什么聚类方法
3.层次聚类的话,你又如何判断聚成多少类合适?
二面之后还有个VP面,也简单聊了聊技术,最后拿到了offer
*********************************************************************************************************************************************************************************
好未来
一面
1.用过什么语言,用没用过R,语言都干什么用的
2.朴素贝叶斯原理
3.TF-IDF原理
4.性能评价指标,准确率召回率是怎么回事,二分类 和多分类的评价方法
5.除了推荐方面的东西,你还做过一些别的事情么
6.用过scikit-learn numpy么
7.LDA你是怎么用的,LDA的表现如何,主题分的效果好不好
8.你觉得基于内容的方法和协同过滤有什么不同
9.还有就是一些基本情况了,用没用过数据库啊之类的,数据库用的怎么样 sql会不会
面试小哥说他们是做NLP的,感觉我比较适合推荐的组,说给我把简历递过去,但是就没有后续了
*********************************************************************************************************************************************************************************
数旦科技
一面
1.数据库 三范式
2.bagging 和boosting 哪个可以让结果的方差更小一些,为什么?
3.你都知道哪些分类算法
4.bagging 和boosting的区别是什么
5.排序算法都有什么?当一个数据特别乱序的时候使用哪个排序算法更好一些
6.你论文都怎么搜索的,如何保证质量?
7.面向对象 多态 继承 的关系
8.面对大数据量的推荐 应该如何实现
9.说说协同过滤是怎么回事
10.你常用的推荐算法都有什么
11.集成学习为什么要用简单的基学习器,不用一个复杂一点的学习器
12.非线性的数据,可以使用什么分类器进行分类
这个还有二面,但是二面没问太多技术问题,后来就莫名其妙没有后续了
*********************************************************************************************************************************************************************************
搜狐算法实习生
一面
先问项目,然后
1.LDA的原理是什么?
5.推荐的时候矩阵一定是稀疏的,对于这个稀疏矩阵应该如何处理?
6.如何从文档中提取关键字?
7.讲一讲tf-idf是什么意思
8.hashmap你用过么,底层是如何实现的?
9.计算机网络你有学过吧,还记得什么么?
10. Android 的生命周期是什么?
11.你用过Python 那么你Python都用过哪些机器学习的库?
12.你觉着你自己都有哪些优点呢?
这是春招初面,什么都不会。。顺利凉凉
搜狐(智能推荐平台)
一面
主要问的都是项目
手撸代码,不用库函数求一个数的立方根,要求误差小于0.01
代码没撸出来,再次凉凉
*********************************************************************************************************************************************************************************
以上是所有春招的面试经历,除了这么多一面就挂的,还有很多简历挂,笔试挂的。最终拿了美团点评和GrowingIO的offer,然后选择了去美团实习,共三个月。
秋招
阿里 口碑 算法工程师-机器学习
一面
1、项目
2、如何在实际场景中实现项目,需要做哪些改变与考虑
3、代码题,如何不使用库函数(+-*/)实现一个加法计算函数,入参为两个字符串,返回值为两个字符串
4、逻辑回归的思想和过程,损失函数是什么,如何训练得到最优参数
5、如何防止过拟合
6、L1正则不是连续可导的,那么还能用梯度下降么,如果不能的话如何优化求解
7、树模型的分裂依据都有哪些
8、支付宝年末要出一个年终总结,那么我要对所有用户的交易额度进行全量的排序,那么内存肯定是不够用的,这种情况下应该怎么做
9、在一个坐标系内,用户和商户都有自己的坐标(x,y),那么我想找到距离用户最近的k个商户,如何最快的得到
10、口碑要拉新客,我们的策略是发红包,怎么如何在预算有限的情况下发红包能让最多的用户来安装口碑呢
11、在美团都做了哪些工作,简单说一下
秋招第一次面试,一面遇到P8大佬,准备不充分的情况下,顺利凉凉
*********************************************************************************************************************************************************************************
百度 展示广告部 机器学习/数据挖掘/自然语言处理工程师
一面 (电话)
1、介绍一下新闻推荐的项目
2、介绍一下美团实习的方向,负责的内容
3、GBDT+LR的原理
4、GBDT+LR中,如果GBDT有有1万颗树,每个树有100个叶子节点,那么输入到LR的特征会是一个高维稀疏的向量,那么应该如何处理,使用PCA降维的话会造成损失,如果不想有损失的话应该怎么办
5、GBDT的原理
6、GBDT在回归和多分类当中有什么不同,在预测的时候的流程是怎样的
7、逻辑回归如何防止过拟合
8、L1、L2正则化的区别是什么
9、L1正则相当于拉普拉斯先验,那么在损失函数为最小二乘法的时候,如何通过拉普拉斯先验推导出L1正则
10、L1正则是不可导的,那么在这种情况下如何优化求解损失函数
11、坐标轴下降法的原理是什么,还有别的方法求解么
12、你所使用的GBDT+LR的代码中,LR的优化方法是什么,是如何实现的(看源码)
13、算法题,有一个n*n的数字矩阵,我要将其向右旋转90度,应该如何实现,时间复杂度是多少
二面 (上研现场)
1、介绍实习的项目
2、GBDT不擅长处理离散特征,你在应用的时候是怎么处理的
3、项目中LR用的优化方法是什么,有没有用正则化,有没有调整sgd的步长
4、你还知道哪些优化方法
5、GBDT+LR中LR输入的特征都有哪些,除了GBDT输出的特征 有没有加入原始特征
6、如何判断模型有没有过拟合
7、100块钱,每次可以花1、2或者3块,有多少种花法
8、算法题,用两个栈实现一个队列
9、手推逻辑回归
三面 (电话)
1、讨论论文
2、tf-idf在提取关键字的时候有没有遇到问题
3、userCF在现实场景中实现遇到的问题,如何解决
4、有一个特别长的数组,放不进内存的情况下,找出最小k个数
5、蓄水池抽样
6、逻辑回归的特征处理,连续值、离散值,离散化连续特征的好处
7、L1、L2正则化
8、模型在线下可以得到很好的效果,但是上线后效果不好,有哪些原因
9、实习项目
10、项目中如何判断是否拟合、如果离线数据不能很好反映全集的情况如何处理
11、进程间通讯都有哪些手段
12、父类变量指向子类实例的情况下,在调用方法时是如何判断调用的是父类的方法还是子类的方法
13、多线程锁
完成了三面,个人感觉良好,等了很久没消息后,问了面试官,告知凉凉
*********************************************************************************************************************************************************************************
今日头条 上海 算法工程师
一面
1、讨论论文
2、user-cf、item-cf公式,原理区别
3、讨论实习
4、手写堆排序
5、手写快排
二面
1、topk
2、手写代码实现lr的训练与预测
当时的我还不会手写堆排序。。凉凉
*********************************************************************************************************************************************************************************
美丽联合 应用算法工程师
一面 20min
1.聊了实习里面很小的一个点,大约3min
2.手撕代码 最长连续合法括号子序列
最差的一次面试体验,真的是不缺人?一定要吐槽一下,论文、实习的主要内容都不问,机器学习算法也不问,直接手撕LeetCode hard难度代码,没写出来就挂人??
不缺人何必约面试呢。
*********************************************************************************************************************************************************************************
海康威视 研究院 大数据算法工程师
一面(电话)
1、GBDT原理
2、GBDT在处理onehot属性时,当1或者0的数量很多的时候是否会发生问题
3、Xgboost 和GBDT区别
4、如何判断是否过拟合
5、实习
6、既然GBDT处理onehot属性时存在问题,为什么你们还要这么做
后面通知了现场面试,但是由于当时有事过不去,只能鸽了
*********************************************************************************************************************************************************************************
网易游戏 雷火 数据挖掘工程师
上午面了三面,发现雷火的数据挖掘实际是大数据开发,并不是算法岗。。
问了很多Hadoop
spark hive的底层内容和算法能沾边的问题不多,如下:
1、SQL题
2、二叉树中序遍历,递归非递归
3、情境代码题(具体记不清了)
4、user-cf中计算近邻用户的距离度量方法有哪些,如何选择
5、激活函数比较
6、推导逻辑回归
互相不匹配,凉凉
*********************************************************************************************************************************************************************************
阅文集团 算法/机器学习工程师
一面
1、实习感受
2、实习内容
3、讨论一个算法项目的流程
4、特征处理与选择
5、GBDT+LR
6、讨论论文
7、主题模型
8、命名实体识别
二面
1、实习
2、论文,关于推荐系统的一些看法
3、逻辑回归的原理与推导
4、item-cf与user-cf与基于内容的推荐的区别
5、逻辑题(具体记不清了)
HR面
工作如何选择
未来规划
女朋友
东北人为啥要来上海
薪资期望
由于很多问题都是根据论文和实习展开问的,所以显得面试问题不是很多,其实面试时间都有50min左右。
很幸运赶上了阅文第一次提前批,来了东北大学。面试很效率,很友好。
十一之后收到了offer 小sp
*********************************************************************************************************************************************************************************
秋招就一共面试了这么多家。还有一些做了笔试没给面试机会的,比如:京东、网易互联网、哔哩哔哩、滴滴。一些投了简历没消息或直接挂了的,如:51信用卡、点我达、有赞。
最终拿到了阅文的sp offer 和美团实习留用的 sp offer,其他的都凉了或者在凉的路上。希望这些面经能对大家有所帮助。
作者:人生啊这么长
链接:https://www.nowcoder.com/discuss/128148
来源:牛客网
1、美团
美团AI提前批专场面试
1.1 美团平台
16:15-16:50
- 视频分类难点有哪些
- 项目相关
- 你在团队都负责什么?
- 你细粒度分类调研情况如何?
- 给你一个场景:超市,需要上万种物品目标定位检测、识别,需要细粒度分类,如何处理给你一个场景:
- 如何划分一级标签、二级标签的?人工还是?
- 论文你有吗
- 你知道attention起源是用在哪里?pixel还是frame,是soft还是hard
- 介绍下都有哪些优化?
- 项目相关
- 你毕设做的什么?
- 那untrimmed和trimmed,你认为untrimmed的难点是什么?
- 其他项目都是偏工程的,那还有算法吗?
- 你对美团技术有什么了解
- 你职业规划是什么?做研究?做业务?做基础平台?
- 你还有什么要问的?
1.2 无人配送
15:17-15:27
- 自我介绍
- 那你这个项目咋么做的?
- 你们做了哪些改进,有改进网络结构吗?
- 有什么提高吗?
- 数据集
- 项目相关
- 你做的工作有哪些?
- 你对这边的了解有哪些?
- 你想做哪些工作?
2、大华
2.1 一面
13分钟
- 自我介绍
- 详细介绍项目怎么做
- 项目相关
- 网络用的损失函数是什么
- 还有用什么损失函数吗?
- 监督信息是什么
2.2 二面
37分钟
- 自我介绍
- 介绍项目、数据集
- 讲一下毕设,什么时候开始
- 效率问题
- 比赛工作内容分配、几个人等
- softmax loss
- 全连接的作用
- GD、SGD、mini batch GD的区别
- 用什么语言,C++代码量有多少
- static
- 结构体占多少字节
- 函数中的局部变量在内存中如何申请
- S3D了解吗?
- 你什么时候接触深度学习的?实验室有几张卡?老师做什么的?
- 图像处理学过吗?
- 边缘检测算子有哪些
- 霍夫变换
- 已经有毕业资格了吗?
- 直方图是什么?
- 做目标检测的话,数据集用什么
- 你们与前面几名的差距是多少
2.3 HR面
13分钟
- 自我介绍
- 对这个岗,你有什么优势
- 你自己技术方面的优势
- 比赛的工作内容分配
- 工作地点
- 对大华有什么了解
- 实验室情况
3、CVTE
3.1 一面
23分钟
- 项目
- 项目巴拉巴拉
- 传统图像处理、边缘检测
- canny算子是怎么做的?
- 传统机器学习有了解哪些?
- 说一下SVM核函数
- PCA:SVD分解
- 霍夫变换
- 过拟合
- L1、L2范数,L1趋向于0,但L2不会,为什么?
- 偏差、方差
- inception v2、v3区别
- resnet好处
- 为什么用LR,不是0-1
- sigmoid优缺点
- 讲一下LSTM
- 你有什么问题
3.2 二面
32分钟
- 讲一个你觉得最满意的项目
- 介绍比赛是怎么做的
- 你做了那些工作
- 你认为你在团队中排第几
- 你还有那些工作
- 你们这个项目可以用在工业界什么地方?
- 图像的特征提取有哪些算法
- 那你知道他们的适用范围、优缺点吗?
- L1 L2范数了解吗?区别
- 偏差是什么
- 余弦相似度距离和欧氏距离的区别?
- 你知道其他距离度量公式啊?
- PCA
- 你认为深度学习是最好的方法吗?
- 那你觉得哪些时候不能使用深度学习
- 给你一个烤箱,你需要识别烤箱中的食材,怎么去做?
- 没有数据怎么办
- 如果数据不好怎么办,数据不均衡怎么处理、只有少量带标签怎么处理
- 模型不好怎么办,效果不行
- 烤箱设备升级,照明、摄像头位置等提高,但是原有的模型准确率却下降了。怎么办
- 你有什么问题
3.3 HR面
35分钟
- 之前两面打分,为什么
- 找工作的情况,有没有offer
- 意向公司、目标企业
- 找工作的标准
- 对实习公司的评价
- 那为什么不留在实习公司
- 最好、成功的一件事
- 最大挑战的一件事
- 失败的事情或者说没有达到期望
- 自己有做过哪些分外之事
- 家庭情况、工作、性格、身体、年纪
- 父母谁对自己影响比较大
- 父母对你的期望
- 至今为止对你帮助最大的一个人
- 至今为止对你影响最大的一个人
- 哪个时间段压力比较大,身体、心情
- 5-10年的人生规划,事业和家庭
- 人生理想
- 拿到offer,为什么不来
- 来了,为什么后来又离职
- 期望工资、地点、工作时间
- 同一批同学工资比你高,你怎么看
- 最后没拿到offer,你认为为什么
- 自己做过哪些重大决定
- 在哪个领域有深入的了解
- 有哪些兴趣爱好
4、顺丰
4.1 一面
25分钟
- 自我介绍
- 介绍怎么做的
- 项目相关的一堆问题
- 你还做什么
- 讲一下目标检测都有哪些方法
- 讲一下faster rcnn
- ROI层是怎么实现的,怎么做的映射
- yolo和SSD区别
- 训练不收敛的问题
- 数据集不好
4.2 HR面
27分钟
- 面试官有没有给你介绍公司
- 介绍了项目
- 实习经历
- 比赛怎么做的,负责的工作
- 如何选择一个公司
- 工作地点
- 项目有哪些应用
- 兴趣爱好
5、Momenta
5.1 一面
25分钟
- 介绍科研吧,
- 项目相关
- 目标检测
- 求感受野
- 有没有自己写过层,反向传播之类的
- BN层的moving——mean怎么求得
- BN层反向传播,怎么求导
- 还有做过哪些
5.2 二面
25分钟
- 用什么语言
- C++的多态
- 怎么实现
- 最大连续子数组
- python传参会改变原值吗
- 平时看论文吗
- 以后打算做哪个方向
- 有没有自己设计算法
5.3 三面
41分钟
- 自我介绍
- 实习时间
- 介绍一下项目
- 数据集
- 权重怎么设置
- 做了哪些改进,提升
- 目标检测、分割了解吗
- 有用过哪些小网络吗
- mobilenet怎么实现
- pooling层怎么反向传播
- 数据输入是怎么处理的
- depth conv知道吗
- 计算一层的参数量、计算量
- 计算感受野
- 你想做什么方向
6、腾讯
6.1 一面
58分钟
- 自我介绍
- 介绍项目
- 比赛成绩
- 第一名第二名是谁
- 具体项目内容
- BN层怎么实现
- 基础网络模型用了哪些
- resnet第二个版本做了哪些改进
- 有没有做过action proposal
- 目标检测
- xx怎么做的
- xx实习经历
- 还在实习吗
- 实习公司有发offer吗
- 编程题:数组有序,但是循环右移了几位,问新数组中原数组起始位子的下标是多少
6.2 还是一面
1小时28分钟
- 自我介绍
- 问了论文
- 问了比赛,
- 负责的工作内容排第几
- 项目的一堆问题
- 近几年的网络
- mobileNet、shuffleNet知道吗?
- 检测了解吗
- 讲一下faster rcnn
- yolo
- SSD
- bn层怎么做的
- 撕代码:iou计算、k-means
- 其他项目偏算法还是工程,后来有跟进算法吗
- 工作地点
- 博客花了多久时间
7、深信服
7.1 一面
26分钟
- 自我介绍,然后说介绍一下项目
- 比赛
- 你做的工作有哪些
- 你们这个比赛的优势有哪些
- 技术上的改进
- 那之后又做什么?
- dropout
- 给数组,找到加起来是100的一组数。
- 一篇英文文章,统计单词频率,得到频率最高的那个单词
- 给一组整数,无序,在不改动原数组的基础上,请找出1000个位置连续的数,使其和为10万。
- 那如果是不限制个数,只要使其和为10万就可以的数。
- 给10x10的棋盘,扫雷,随机放置10个点作为雷,如何保证随机放置?
- 那你觉得你还有什么优势,我们没了解到的
7.2 二面
40分钟
- 项目
- 实习的工作内容是什么
- 介绍一下比赛方法
- 这个比赛考察什么?
- 工作的话偏向于图像还是可以做文本,
- 过拟合怎么做
- 正则化怎么选择,l1范数、l2范数;
- 介绍残差网络
- 有没有发论文
- 数组n个正整数,每个数值不超过n-1,有一个重复的数,找出那个重复的数
- n位字符串,循环右移m位,要求时间复杂度线性,空间复杂度为o(n)
- 两个图像库,场景一一对应,一个有雨滴,一个没有雨滴,对有雨滴的图像去除雨滴,要不留痕迹。
- 用什么语言
- 写一个函数,只有一条语句,判断数n是不是2的幂
7.3 三面
20分钟
- 自我介绍
- 项目
- 团队分工、负责的工作
- 你有做哪些算法上的创新
- xx做的工作
- 其他领域呢,传统机器学习了解过吗、nlp呢?
- 工程怎么样
- C++代码量
- 实习和实验室的差别,学术上的差别等
8、360
8.1 一面
36分钟
- 自我介绍
- 相似度衡量尺度
- 图像特征提取方式
- 人脸识别,如何输出标签
- boost、Adaboost
- 有其他offer吗、工作地点要求
- 有上线业务吗
- 筛子六个面,每个面的概率不一样,要求实现一个掷筛子的函数。
- 在xx做的什么
- 其他领域有做过吗
8.2 二面
18分钟
- 自我介绍
- 介绍论文
- 介绍比赛
- 应用背景
- C++内部实现机制
- 用过什么指针
- C11特性了解吗
- mat申请一个图像矩阵后怎么释放内存
- 在xx做的什么
- 其他项目
- 什么时候能来实习
9、多益网络
9.1 一面
17分钟
- 自我介绍
- 介绍最好的一个项目
- 比赛这个还有哪些可以拓展的
- 什么是梯度消失和梯度爆炸
- 怎么处理这种问题
- 正则化有哪些方式
- 线性回归和逻辑回归的区别
- 插入和删除用链表还是数组
- 54张牌,分3组,大王小王同在一组的概率
- 什么是SVM
- 有哪些offer,薪资多少,都是人工智能吗?
- 有论文专利吗
- 怎样看待互联网加班
10、网易互联网
10.1 一面
33分钟
- 自我介绍
- 项目
- 学习的项目
- 比赛
- 实习
- 博客链接
- 代码:实现卷积操作
10.2 二面
24分钟
- 自我介绍
- 介绍项目
- 优化算法
- 介绍一下momentum
- 介绍inception网络,主要用来解决什么问题,如何减少参数量
- resnet网络
- 如何避免梯度消失
- 介绍一下BN
- 激活函数
- 权重初始化方法都有哪些
- 代码:归并排序
10.3 HR面
27分钟
- 这次面试感觉怎么样
- 跟其他面试有什么区别吗
- 实习工作
- 比赛负责的工作,几个人
- 创新点等
- 调研工作
- 投了哪些公司,offer,
- 期望薪资,如何定的
- 压力大的时候
- 加班?
11、招行网络科技
11.1 一面
12分钟
- 自我介绍
- 介绍项目
- 机器学习算法了解原理吗,有做过项目吗
- 讲一下CNN,每个层,及作用
- 网络权重初始化
- 梯度消失和梯度爆炸,LSTM中如何解决
- 各种数据的channel是指什么意思
- 如何评估模型
- 如果接触一个新的东西,怎么学习
- 用什么语言
12、蘑菇街
12.1 一面
52分钟
- 自我介绍
- 介绍项目
- 比赛介绍
- 分类,既有河流,又有建筑,怎么做。多标签
- 有个类别总是错分到其他类怎么办
- 精确率高、召回率低是为什么
- 图像处理了解吗
- 有哪些特征子
- 传统机器学习呢
- 讲一下boosting
- BN层
- 目标检测SSD等算法了解吗
- anchor设置的意义
- 一个人有很多框,什么原因造成的
- 用什么框架
- 其他框架呢
- 工作地点意向
- 代码问题:手写直方图
- 用什么语言
- STL用过哪些
12.2 二面
34分钟
- 什么时候毕业
- 考研还是保研
- 工作地点
- 数学课学过哪些
- 项目中有没有实际用到
- 图像处理学过吗
- 什么语言
- 什么框架,看过源码吗
- 介绍项目
- 比赛几个人,你负责的工作是什么
- 你比较倾向的工作内容,感兴趣的领域,视频还是图像
- 深度学习发展,大家都用一样的东西,对自我的提升没多少,你怎么认为
- 职业规划怎么考虑的
12.3 HR面
15分钟
- 为什么投蘑菇街
- 对蘑菇街的了解,你看重蘑菇街什么
- 目前有哪些offer、面试中、等结果
- 如果蘑菇街给你offer,怎么选择
- 如何选择offer
- 蘑菇街跟其他公司比
13、旷视
13.1 一面
57分钟
- 自我介绍
- 项目相关
- data argumentation怎么处理的?
- 人脸识别paper有了解过吗
- 多标签识别怎么做
- 视觉其他领域做过吗?
- faster rcnn和ssd区别
- 其他loss有了解过吗
- pca过程
- 二维平面,一堆散点,找一个条拟合的直线
- 二维平面,一堆散点,找分布函数
- SVM、核函数
- 无监督学习了解哪些
- 模式识别上过课还是自学的
- 图像处理学过没
- 图像旋转、旋转矩阵、像素点怎么填充
- 反转链表
- 最熟的框架
13.2 二面
42分钟
- 介绍最厉害的一个项目
- 第一名是谁
- 数据集
- BN层怎么计算
- iou和NMS怎么算,写代码
- 工程方面的,怎么处理数据
- python多线程多进程
- 你有哪些offer
- 计划实习吗?这半年怎么安排的
13.3 三面
50分钟
- 自我介绍
- 比赛负责哪些工作,第一名是谁,哪个任务
- openpose了解吗
- 都用过哪些网络
- inception v1-v4的区别、改进
- VGG16和resnet152哪个参数量多
- 论文发的哪个会议,讲一下论文
- 1000个视频,无标签,怎么分类预测
- 还做过哪些
- faster RCNN介绍、yolo
- anchor的正负样本比是多少
- 数据不均衡怎么处理
- online hard 样本接触过吗
- 求期望:设随机变量X1,X2,…Xn相互独立,且都服从(0,θ)上的均匀分布。求U=max{X1,X2,…Xn}数学期望
- 反转字符串
- 有一个数target,一个数组,数组中两个数的和是这个target,请找到这两个数
13.4 HR面
26分钟
- 面试感觉,与其他面试有什么不同
- 印象最深的面试官
- 自我介绍
- 实习工作
- 比赛负责的工作
- 工作任务怎么分组,业务导向
- 对实习的感受,氛围,有什么业界知名人士吗,发表论文什么的每年多少CVPR、ICCV、ECCV等
- 压力大的时候
- 哪里人
- 怎么选择工作
- 期望企业
- 有哪些offer,给了多少钱,期望薪资
13.5 终面
32分钟
- 问比赛
- 比赛的含金量
- 有做改进吗
- 与前几名相比呢
- 与去年相比吗
- 你负责的工作是
- 介绍项目的方法
- 当前还存在什么问题,你认为后续发展方向
- 传统机器学习用过吗
- 还了解哪些领域
- 你用什么框架,各个框架的实现机制有什么不同
- 过拟合是怎么造成的,如何解决
- bias variance
- 用什么语言
- C++一些语法特性平时项目中会用到吗,比如多态、继承等
- set map低层实现的数据结构是什么
- map,m[1]="str";这句低层是怎么实现的,发生了什么
- 数学怎么样
- 上次编程题反转字符串写出来了吗
- 你希望工作偏研究还是工程
- 对现在创业公司的看法,
- 你自己的优缺点
14、vivo
14.1 一面
26分钟
- 介绍最得意的一个项目
- 比赛的影响力
- 一共几人参赛
- 你负责的工作
- 讲一个比赛用的算法
- 一个1-n的数,少了一个,找出来
- 1-n,少了两个数,找出来
- 计算1-100的质数和
- 你觉得你的项目可以用在vivo的哪些产品上
14.2 HR面
20分钟
- 自我介绍
- 本科是一本吗
- 保研还是考研
- 本科班级排名
- 比赛、比赛规模
- 为什么做这个比赛
- 工作地点
- 家庭情况
- 其他公司有投吗
- 意向薪资
15、虹软
15.1 一面
24分钟
- 自我介绍
- 介绍项目
- 用什么框架
- 论文
- 比赛
- 网络结构
- 多少队伍、团队人数
- 你负责的内容
- 数据集
- 细粒度分类
- 你以后想做哪方面内容
- 有没有用在实际场景中,
- 数据集上会不会过拟合
- 用什么语言,熟吗
- opencv怎么样
- 图像处理怎么样
- 笔试成绩怎么样
- 期望的工作地点
15.2 二面
43分钟
- 自我介绍
- 介绍比赛
- 算法框架
- 做了哪些改进
- 我负责的工作
- 博客里写的网络都用过吗
- 博客里各种归一化层有实现吗
- 感兴趣的领域
- 反向传播求导,给了个例子链式求导,pool如何反向传播
- 最长回文子串
15.3 HR面
38分钟
- 工作地点
- 实习,学到了什么
- 对虹软的认识
- 有哪些offer,意向公司等
- 考研还是保研
- 三个词描述自己,为什么
- 对自己两三年的计划
- 对女生做计算机有什么看法
16、欢聚时代
16.1 一面
26分钟
- 项目介绍
- 继续介绍
- 光流怎么计算
- 数据标注怎么做?
- 实习经历
- 人脸识别也做过?
- 除了做视频,还做什么?
- 声音特征是怎么提取的?
- 创新点
16.2 HR沟通
7分钟
- 为什么会投YY
- 之前对YY有了解过吗?
- 有转正offer吗?
- 最想去的三家公司
- 看你之前在xx实习过,后来为什么又去了xx
- 那你在实验室的项目都是什么?
- 那你如何选择offer?
- 你对地点有要求吗?你是哪里人?
- 你薪资大概要求多少?
- 你还有什么问题?
- 那你对岗位工作内容怎么看,有兴趣吗?
16.3 二面
20分钟
- 自我介绍
- 具体介绍一下怎么做的
- 介绍基础网络inception
- 介绍resnet
- loss怎么设置
- SGD各个参数怎么设置
- 权值衰减这个参数怎么设置,
- 优化器选择
16.4 三面
20分钟
- 自我介绍
- 比赛具体怎么做的
- 数据集多少
- 训练一个网络要多久时间
- 你负责哪些工作
- 代码量
- 与第一名的差距
- 论文主要思想
- 用什么框架
- 低层代码用看过吗
- 什么时候进的实验室
- 这段实习,他们是做什么的
- 用在哪些业务上
- 工作地点
16.5 HR面
26分钟
- 自我介绍
- 被打断,说不要介绍技术,就说除了技术之外的
- 在xx做什么,收获了什么 、最大的挑战
- 个人优点和缺点
- 对YY的看法
- 如何选择工作,
- 有哪些offer
- 抗压能力
- 家里几个孩子
17、头条
17.1 一面
56分钟
- 介绍最好的一个项目
- 问项目里面的 loss
- python多进程 多线程,为什么多线程比较鸡肋
- python是解释语言还是编译语言
- xrange与range的区别
- 迭代器,啥来着,忘了
- STL中vector的低层实现
- STL中插入的操作时间复杂度,要考虑内存复制扩充,
- 如何实现一个栈,支持动态扩充
- 如何用链表实现一个栈,
- 如何实现一个栈,O(1)获取最小值,get_min
- 如何节省空间,存放最小值,如果有多个,不想多次存放
- 用map计数,但是需要O(logN)的复杂度查找;用数组计数,空间复杂度更大用数组计数,空间复杂度更大;设置结构体,除了value,还有一个count值,计数。即前面已经用了链表,节点结构体含有,value,count,next;
- 好了,前面说了这么多,你把这些条件都实现了吧,写代码
- 计算feature map的size,卷积层参数量
18、图森
18.1 HR面
7分钟
- 一句话介绍自己做什么
- 实习都做什么工作
- 有做哪些改进
- 有哪些offer
18.2 一面
42分钟电话面试
- 介绍项目
- 边介绍项目边问问题
- 那些网络?
- 项目巴拉巴拉
- 细粒度分类
- 介绍BN
- 项目巴拉巴拉
19、触宝
19.1 一面
50分钟
- 自我介绍
- 介绍项目
- 数据集 哪些类别 标签
- 数据不均衡
- 过拟合
- 蒙哥特洛方法
- 手写快排
- 手写:给数字N,表示以后N对括号,求所有可能的合法括号
- 判断括号是否合法
- shell
- 查看文件大小命令
- 查看文件多少行命令
- 如何后台起一个服务
- softmax和logistic的关系,可以推导吗
19.2 二面
53分钟
- 自我介绍
- 介绍项目
- 介绍算法导论都有哪些方法
- 动态规划和分治的区别与联系,各自适应哪些情况
- C11特性有了解吗
- STL用过哪些,低层实现
- set、map的查找复杂度、插入删除等
- 手写vector实现
- 机器学习算法了解哪些
- LR手写代码
- 激活函数有哪些,各自区别
- 梯度消失、梯度爆炸问题怎么处理
- BN层,先加BN还是激活,有什么区别
- 损失函数有哪些
- 优化器有哪些,怎么演进的,平时怎么用,如何调参数
- 对工作内容有什么要求
- 如果给你offer,你会来做语音识别、NLP吗
19.3 三面
31分钟
- 写个代码:字符串转数字
- 介绍项目
- 你自己做吗,分工
- 如果分类结果不好怎么办
- 传统机器学习了解吗,我看你博客有写
- LR,给你数据,进行性别分类,有:身高、体重、兴趣,注意有些特征连续,有些是离散的,怎么用LR来做
- 特征维度是多少维度
20、阿里
20.1 一面
53分钟
- 自我介绍
- 介绍了项目
- 实习经历
- 什么时候开始做算法的?
- 当时去xx的契机是什么?收获是什么?
- 比赛、结果等,你学到了什么?
- 学校的项目有哪些?
- 有什么成果产出?
- 讲一下论文大概思路,创新点是什么?整个网络架构?
- 有没有考虑应用?
- 还有其他项目吗?
- 如果用在移动端,如何处理?有这方面的经验吗?
- 有哪些应用场景?
- 如何做到real-time?
- 之后有什么拓展?
- 写博客的目的?从什么时候开始写的?
- 你打算来杭州工作吗?有投其他公司吗?
20.2 二面
25分钟
- 先自我介绍一下
- 项目
- 数据集?
- 业务中怎么用呢,有产品落地吗
- 介绍一下你们的算法架构
- 做的改进
- 多少人参加,会公开技术方案吗?其他是怎么做的?
- 你们还有做哪些尝试,或者踩过得坑
- 你自己还做过哪些,
20.3 三面
1小时31分钟
- 自我介绍
- 介绍了项目
- 比赛怎么做的
- 论文思路
- 创新点、贡献点
- 在xx时的工作是做什么
- 是什么平台?是什么工具?工作内容是什么?
- xx做的是什么?
- 这个项目怎么做的
- MFC界面通信怎么实现
- mysql都有哪些操作
- 博客链接在哪里
- 编程:强盗抢东西那个题,优化了3次
20.4 四面
32分钟
- 面试官介绍他们那边在做什么
- 你有什么问我的
- 最能展现你技术水平的一个项目
- 你认为还有哪些优化的地方
- 研究生学过算法设计没?学过什么课程
- 字符串的全排列
- 学过数理统计没?
- 那假设检验学过没,实际中用到过吗?
- 论文中,怎么跟baseline比较,你的算法好呢?
- 噪音干扰怎么办
- 你还有什么问题?
20.5 一面(五面)
34分钟
- 自我介绍
- 项目:怎么做、用在哪里、比赛算法框架、
- 数据处理、分析等一些心得
- 项目
- 论文内容
20.6 二面(六面)
42分钟
- 介绍自己工作、亮点
- 图像库,给一张图像,找出图像库中最相似的那个
- 快速找到一个数字的开五次方根
- 一个数,0-1024,最多几次找到这个数
- 52张牌,摸5张牌,求顺子的概率,,允许不同花色
- 工作城市、什么时候毕业、哪一年的
20.7 三面(七面)
26分钟
- 介绍xx这边的工作
- 介绍比赛,比赛算法等
- 介绍后续工作
- 你认为这个比赛还有那些改进的
- 你认为过程中比较有挑战性的问题
- 如何加快迭代速度
- 用的什么框架
- 这个项目怎么做的
- 你认为后续如何发展
- 做这个比赛有用在哪些业务上吗
- 你对视觉哪个方面比较感兴趣
20.8 四面(八面)
28分钟
- 介绍自己的项目
- 还有哪些改进,
- 其他团队用的什么方法,第一名用的啥?
- 你们这个最后有落到产品上吗
- 项目巴拉巴拉
- 适用范围
- 介绍论文
- 你还有其他项目吗,或者其他方面的研究
- 那你介绍一下对目标检测的了解
- 还做过什么?
- 其他公司也实习过
- 你对应聘的部门有了解吗,知道是做什么的吗
- 你对阿里怎么看,offer怎么考虑
20.9 HR面(九面)
17分钟
- 为什么想来阿里,项目实习经历,在阿里的规划
- 你的一些竞赛经验
- 那个比赛对你来说帮助比较大
- 你的实习经历
- 那个实习经历对你帮助比较大
- 转正offer吗
- 家庭
- 你还有什么问题
21、搜狗
21.1 一面
46分钟
- 自我介绍
- 介绍项目、比赛
- 数据集
- 怎么做的
- 一秒多少数据
- 什么框架
- 团队多少人
- 介绍负责的工作
- 数据增强
- 正则化
- dropout
- BN层、参数量
- 卷积是怎么实现的,比如caffe中卷积的实现
- 其他损失函数
- inception v1中的inception结构怎么设计的
- 为什么使用1x1卷积核
- STL中vector的resize函数、reserve函数
- 多态
- 引用和指针的区别
- C++中内存管理
- 堆和栈的访问哪个更快
- 如何求二叉树的深度
- 图的遍历方式
- 广度优先可以用来求二叉树的深度吗
- Linux下有用C++编程吗
- 你还有什么问题
二、春招
1、腾讯
1.1 内推一面
11:13-12:17
- 问了实习时间
- 项目的相关问题项目的相关问题
- 行为识别主要有哪些技术?行为识别主要有哪些技术?
- 应用场景是什么?数据集怎么采集?应用场景是什么?数据集怎么采集?
- 你这个项目是实验室上一届就有做,你在上面继续优化,还是你从头开始的?
- 对CNN的理解
- 如何用到CNN的?比如用CNN解决了一个原先算法无法解决的问题,还是说刚上来就用CNN?
- 还了解过哪些网络?
- 你对GAN的理解?用DCGAN来做什么?
- 你的职业规划是什么?
- 你的博客都写什么
- 你都看过哪些论文
- 二维矩阵,行、列皆有序,用O(M+N)查找一个数是否存在
- 介绍他们部门与研发流程
- 还给了一些指导和建议
1.2 正式春招一面
19:04-19:50
- 介绍项目1,问了巴拉巴拉
- 介绍项目2,问了巴拉巴拉
- 介绍项目3,问了巴拉巴拉
- 你们这都是用别人的网络,自己有做什么吗?
- 你们都是堆网络,有想过别的什么提高吗,比如训练方式上
- 那你们是做分类任务,那后面怎么应用呢?
- 那你有了解嵌入式吗?怎么应用你的场景?
- 那你们既然做应用,实时性这个怎么办?
- 你有了解过mobilenet这种轻量级的网络吗,直接就可以在移动端用的
- 那你有移动端的经验吗?
- 那你们现在就是在数据集上做是吗,有做过实际场景处理吗?
- 实习的工作内容是什么
- 一道编程题:给定一个单链表,一个数x,然后你把这个单链表改成前面是比x小,后面是大于等于x的顺序,然后每个部分仍然保持原来链表的顺序。
- 一道推理题:三个连续数,大于6,其中两个是质数,问第三个一定能被6整除。
- 意向城市
2、阿里
2.1 一面
面试28分钟
- 自我介绍,介绍一下项目经验
- 介绍一下项目,是怎么做的,数据集,效果,最优比较,应用背景
- CNN的经典模型
- 介绍一下logistics regression
- 随机梯度下降和梯度下降
- 优化算法有哪些,了解过吗?原理是什么?
- 图像处理的其他算法,比如提取特征
- opencv用过哪些?
- 卷积操作
2.2 二面
面试14分钟
- 介绍一下研究生期间的项目和你负责的工作
- 数据集
- 项目相关的一些问题
- 那你都是怎么写这些网络的
- resnet,你有了解吗
- 那你了解其他神经网络吗?比如Inception
- 那你知道inception后来有哪些改进吗?
- 那你知道一些细节的改进吗?比如你刚才说的BN就是inception提出的
- 那你在训练时有用什么激活函数吗?
- 那你知道为什么不用sigmoid而用relu吗?做出了哪些改进?
- 那你在训练时有用什么优化器吗?
- 那你知道他们是如何改进的吗?
- 你现在电脑在旁边吗?方便做一下在线编程吗?半个小时,第二天做的
- 你的意向工作城市是哪里?
3、美图
3.1 一面
09:50-10:35
- 自我介绍
- 具体介绍一下项目
- 有用过pre train吗?
- 那你每个准确度是多少
- 那你就是复现论文吗?有做什么改进吗?
- 对数据集的处理是怎样的?
- 还了解哪些网络模型?
- 介绍resnet,残差网络
- 梯度怎样计算的,为什么这里梯度不会消失,推导一下。
- 你是哪里人啊
- 你能来实习多久?
- 目前有几个offer?
3.2 二面
10:37-11:00
- 你还做过图像哈希,介绍一下
- 你最想去哪个公司工作?
- 你认为工作后那几年作重要?你有一个什么样的规划?
- 对于大公司和创业公司,你选择哪个?
- 对于大公司做一颗螺丝钉和小公司做一个大部件你是怎么认为的,倾向于什么?
- 你期望在哪个城市工作?
- 你对美图有什么了解?
- 什么时候可以来实习?
- 你在xx实习过4个月,为什么离职了呢?
3.3 HR面
11:00-11:18
- 什么时候来实习?具体实习时间是多久。
- 对美图的了解?
- 你做过两次实习,工作怎么样?有意思吗?
- 培养实习生,干了一两年就走了。然后希望能多做下去。
- 问这周五能来报到吗?
4、京东
4.1 一面
15:50-16:10
- 自我介绍
- 我们这个岗位其实不是做视觉的,是做分布式计算,多机多核并行计算的。你有过这方面的知识积累吗?
- 计算经过卷积操作后的feature map大小。
- 你对tensorflow了解多少
- 那你知道它的dataset和???这个模块吗?
- 那你知道现在是到版本几了吗?
- 你知道python的???模块吗?
- 你说阅读最新论文,你都读过什么论文?
- 介绍一下resnet网络。
- 那你们做这些项目,有什么应用吗?学术上只要有效果就行,那在工业上怎么用呢?
- 介绍下什么是过拟合,怎样解决过拟合
- 那你说一下dropout和batch normalization。
- 你了解x吗?那你写了这么多博客,在写和参考别人的时,都会有意无意积累一些知识,怎么会不知道呢,那你博客都是原创的吗?写的都是什么内容?
- 你在xx实习过,都是做哪些工作吗
- 你能什么时候来实习,实习多久?
- 你这个xx项目是怎么实现的,有什么功能?
4.3 二面
10:58--11:08
- 不用自我介绍。你来说还是我来问?
- 一面面试官有问过你什么?(因为岗位不符,但还是通过面试了)
- 那你为什么还来面试?
- 你在xx实习过,都做过什么工作,老师让出去实习吗?
- 你还有什么想说的?
- 你还看过GAN,是后来用的吗?
4.3 HR面
9分钟
- 自我介绍
- 考研还是保研
- 那你为什么报考xx,通过什么努力考上的xx
- 我不是问你怎么复习的,我是问你做了哪些努力?
- 那你觉得你本科学校和研究生学校有什么不同?
- 那你自己都是怎么学习的呢?
- 你的优势是什么?
- 我不是问你性格,我是问你因为你的优势获得哪些成就
- 你有哪些缺点,
- 你怎么保证高效的完成自己的事呢?
- 你遇到的最大困难、挫折是什么?
- 那你就是在学校只学习没有参加活动咯?
- 我刚才问你的问题就是想知道你是否参加一些活动,你一直聊得都是学术上的我刚才问你的问题就是想知道你是否参加一些活动,你一直聊得都是学术上的
- 那今天就面到这里吧。
4.4 四面
13:20-13:40
其实不是面试,就是问,如果给我发offer,会不会来,
聊了一下,问了问工作内容、地点、转正、时间什么的
5、360
5.1 一面
10:32-11:08
- 自我介绍
- 线程和进程 区别
- 那进程间可以通信啊,什么方式
- 线程可以通信吗?
- 线程有哪些状态
- 你了解多线程、多进程吗?有写过吗
- python中怎么实现多线程、多进程的?
- python中的多线程是真的多线程吗?
- 指针和引用的区别
- TCP和UDP的区别
- 内存中堆和栈的区别
- C++中多态了解吗?
- 项目
- 你数据结构怎么样
- 了解哪些数据结构
- 那链表你知道??
- 手写代码:反转链表、快排
5.2 二面
14:30-15:14
- 自我介绍
- 多态你知道吗?怎么实现的?
- 你写一下吧
- C为什么比C++快?
- 介绍一下你这个xx项目吧,我们也不太了解
- 那你们数据集哪来的?
- 那你们应用场景是什么?
- 你这个xx项目是做的什么
- 那这个项目呢?
- 你在xx的实习工作是什么,他们的工作是做什么的
- 如果给你一个课题,让你去实现,怎么做?
- 那你如果给你数据,模型,你的结果不好怎么办
- 那你知道怎么结果过拟合吗?
- 你知道导数在物理上的意思吗?
- 那你知道二阶导吗?
- 拐点怎么求?
- 你网络了解多少?
- 你这个CCF软件能力认证是什么?
- Linux用的多吗
- 那你知道grep命令吗?
- 那你在Linux怎么写代码?
- 那你了解shell吗?
- 写一个二叉树非递归的中序遍历
- 你知道这个函数是什么意思吗?(我写在节点结构体中的初始化函数)
- 你在xx为什么不继续实习了?
- 那你们老师让实习吗
- 那你们有汇报吗?
- 你什么时候能来实习?
- 那你愿意来我们这做NLP、数据挖掘什么的吗?
5.3 HR面
15:37-15:47
- 自我介绍
- xx项目是用在哪里的?
- 现在已经在用了吗
- xx这是什么项目,那你现在觉得当时还有什么改进吗?
- 你在xx实习过,都做得什么工作?
- 你在xx实习过,这是个什么公司?
- 那你还没有过视觉方面的实习是吗
- 你C++上过课是吗
- 那你自学过其他语言吗?
- 你有什么兴趣爱好
- 你还有什么问题?
5.4 四面
14:00-14:30
- 问了之前来面试的情况,然后说,上次面试部门是xx,那边hc不多,然后就推到他们这边了。HR说是基本可以发offer了,但是他之前也没有了解过,还是想再面谈一下。
- 已经有什么offer了吗?
- 你比较偏向于哪个?
- 介绍了他们这边是做什么的?
- 快排手写
- 了解过hadoop吗?MapReduce呢?
- 讲下MapReduce的理解;
- hql
- 查询表A中有但表B中没有的?
- 两个表做连接
6、58同城
6.1 一面
17:07-17:27 20分钟
- 自我介绍
- 项目
- 有什么策略,
- 你做过哪些优化?
- 你后面会做传统机器学习方法吗?
- 那你了解哪些基础?
- 那你介绍一下LR
- 介绍一下SVM
- sigmoid函数公式
- 你还有什么问题
作者:我不是渣神
链接:https://www.nowcoder.com/discuss/36815
来源:牛客网
一、拼多多提前批
1、问主要编程语言。会java吗?会hadoop吗?描述项目。
2、描述word2vec算法,描述sent2vec,描述一下sent2vec怎么得到向量?(当时没复习,不会)
3、我们的商品的标题有几十个字符,怎么得到和某个商品最相似的K个商品?(我说先分词再用词嵌入,平均之后拿这个向量互相算余弦距离)
4、他于是问得到向量后,如何在几千万甚至上亿个商品内找到前K个最相似的。如果提高效率?(我说哈希分片到不同机器并行运算,他说这样是可以,但是总复杂度没降下来,要用什么高维特征检索,我猜测有点类似kd-tree的意思)
二、小红书提前批
1、最有意思的项目。
2、在线做题。一个m*m的矩阵,其中每个n*n矩阵中都有一个最大值(n<m),求这些最大值的之和。(我没做出来,写得很烂。实际上一维的这个问题中,滑动窗口求最大值的和要实现O(n)也需要双端队列去做这个事(左神书P19)。二维的相当于X轴先做一遍、Y轴再做一遍,O(m^2)。最后面试官说这个问题其实是出现在雷达扫描的实际场景中)
三、360提前批
第一次现场面,完全不知道面试是什么套路,稀烂。
1、介绍xgboost一下。写下xgboost目标函数。(因为我提到xgboost在目标函数里显式地加入了正则项..血雪崩)
2、问项目里英语分词器用了啥,jieba用过吗,怎么调整XGB参数,除了logloss用了别的评估方式吗
3、了解其他的分类模型吗,问LR缺点,LR怎么推导(当时我真没准备好,写不出来)
4、写LR目标函数,目标函数怎么求最优解(也不会)
5、讲讲LR的梯度下降,梯度下降有哪几种
6、写代码:快拍,如何写非递归的快排(不会非递归)
7、写代码:最长公共子序列(当时不会写,DP,左神书P210)
7、逻辑函数是啥(Log-Sigmoid,1/(1+e^(-x)))
8、机器学习的模型自己实现过吗(对不起我是真开局一卷草席,装备全靠捡)
8、word2vec是怎么实现的
9、nlp做过吗?讲一讲textrank如何做的(有用过)
10、写一下信息增益
女面试官语重心长地对我说,你小子一个应届生,基础差得一批,啥啥不会,我们这要实现算法的,赶紧滚回去巩固基础,并且多自己实现实现。
四、百度提前批
一面
1、C语言,指针和引用区别(略懵逼,后来发现C里没有引用啊...C++我真不了解)
2、线程、进程的区别(太早以前看的,都忘了,以为算法岗不问这些...)
3、线程间通信方式,进程间通信方式,管道是什么(不会,后来补学了一发)
4、同步、异步区别,服务器客户端场景下(再度答错)
5、堆了解吗?有个什么场景非常适合使用堆?(Top-K问题)Top-K问题怎么用堆,怎么更新堆?
6、红黑树了解吗(具体不了解,只知道是种特别叼的二叉搜索树,为什么叼不知道,大概是比较接近平衡,调整的步骤少)
7、散列表了解吗,怎么存储散列表(基础差真的不行,再次答错)
8、散列表读取的时间复杂度,散列表很大的情况下读取(O(1))
9、hadoop,spark这块用过吗(没)
10、python 垃圾回收机制(不会)
11、python 深、浅复制区别和应用场景(微微一讲)
12、python 可不可以多线程、多进程(我说都可以,不过忘了GIL,晕)
13、python 语言有什么特性 或者你编程时比较喜欢的方面
14、xgboost原理
15、gbdt树根据什么分裂(瞎扯的梯度近似残差、梯度下降方向,其实还是信息增益这种东西)
16、gbdt怎么并发(特征选择层面,树层面不能并发)
17、最长公共子序列,复杂度(DP,时间复杂度O(n*m),空间复杂度可以缩小到O(min(n,m)),左神书P210)
18、写代码:翻转链表(原地翻转,左神书P40)
19、两个单向链表第一个公共结点(左神书P62)
二面
1、写代码:一个有序的连续的数组,其中少一个数,如2、3、5、6、7,O(lgn)找出这个数(写的二分我感觉没错她说我少考虑了...)
3、讲项目,参数是如何调整的,获得了多少收益;一个月的工作中,产生特征的思路,获得了多少收益
4、除了xgboost还知道那些机器学习的模型
5、写一下SVM要优化的函数,直接推导SVM(写到L(w,b,α)时让不用写了)
6、写的过程中问了几个问题,为什么要除以||w||,为什么优化问题中间隔γ可以取1(没答太好)
7、一个六位数的随机密码生成器,不小心拿反了,结果读取获得的密码仍然是正确的,概率多大(前三位和后三位要是中心对称的数字)
8、关键词分析有什么模型,情感分类有什么模型(项目相关)
9、自己搭的搜索引擎结果是如何排序的(elasticsearch用了一下而已),有没有评估效果(没),建索引时和query时分词的颗粒大小
经理面
1、为什么一面面的不好,这些不复习也应该知道,代码是不是写的少,按理学电子的写C也很多(别说了,是我的错,基础差)
2、想从事的技术方向,为什么想做这个(我随意..)
3、为什么说喜欢机器学习,你说的推荐系统和购买预测有什么不同(说不清)
4、未来想做到什么水平,什么人适合做什么,就做什么,不论是技术还是管理,适合最重要,不要羡慕别人的风光
5、当领导需要什么能力,你适合当领导吗
8、怎么学习机器学习,最近看了什么书什么论文,有没有去实现它(说看了gans)
聊人生,特别看重逻辑性
五、58转转内推
1、项目介绍,xgboost介绍
2、为什么要用梯度拟合残差
3、为了达到相似的预测结果,RF和GBDT哪个树深(这个我真答反了,还振振有词地说了一统bagging....可以看看这个https://www.zhihu.com/question/45487317)
4、准确率,召回率解释一下
5、假设加了很多很多负例,auc和prc哪个对此不敏感(实际上auc不敏感,但也有人说因为prc比auc在极端不平衡时曲线差很多,所以用prc能反映真实的分类效果,这个问题各自有各自的道理,可以看看这个https://www.zhihu.com/question/30643044)
6、xgboost对特征缺失敏感吗,对缺失值做了什么操作(知道不敏感,但不知道什么操作..)
7、哪些模型对特征缺失敏感,哪些不敏感(不知道)
8、特征缺失,不用说求均值之类的填补方法,用LR、RF去预测缺失值,哪个好(这个求大佬解答,我真没想明白,我扯的RF,又拎出bagging扯了一番.....)
六、美团内推
一面
1、写代码:一个数组和一个num,O(n)找到数组中两个和为num的数字对的下标(哈希,找num-lists[i])
2、xgboost介绍,项目的一些问题以及没有做到的,很细
3、项目中用到LSTM怎么用的(血崩开始,LSTM真不会,只是用了下)
4、为什么过拟合,怎么判断过拟合,怎么减少过拟合
5、不变动模型和参数,只对数据来说怎么减少过拟合(说是增加数据,略无语)
二面
1、SVM数据线性不可分怎么办 (软间隔,核函数,讲下软间隔)
2、为什么LR要用对数似然,为什么不用平方损失或者差的绝对值之类的损失(我说类似最大熵问题,得到了光滑的凸函数,面试官说就是为了得到凸函数)
3、接上题,LR中使用平方损失会不会形成凸函数(我没敢答,事实上不是)
4、XGB和GBDT区别
5、泰勒展开怎么写(忘了..)
6、L0、L1、L2范式,他们的作用(雪崩2,我以为自己背得牢牢的,然而...其实L1相当于曼哈顿距离,L2相当于欧氏距离,这下不会忘了)
7、外卖时间预测的整个流程(想了一堆特征,天气、路况、外卖员历史速度、菜色大小之类的,监督学习,用XGB之类的回归)
8、LSTM怎么用,back propagation through time是啥,为什么会梯度消失,back propagation推导,讲链式法则(雪崩3,不会深度学习)
9、讲k-fold CrossValidation,然后问说有一百个数,随机选取数字,让其均匀分成十份,不允许有一次碰撞(面试官说随机一个数字后和最后一个数字交换,依次减小数字的范围。略无语,感觉并没有实际解决问题,又在哈希方向思考了半天)
七、作业帮
一面
1、讲项目,特征工程的细节、不足
2、介绍xgboost,讲讲xgboost怎么用以及常用参数
3、介绍word2vec
4、怎么判断是否过拟合,工程上怎么减少过拟合
5、让我用C语言实现char* strcpy(char *strDest, const char* strSrc)(我说不太会C了,只会python做题可以吗..结果开始问python语言)
python:
6、[[],[0,1,2],[]]之类的list用2位置的数排序,sorted(a,key=lambda x:x[2]),排序怎么反向,reverse
7、[[],[0,1,2],[]]之类的list怎么取出2位置是2的形成新的list:[[0,1,2]](还真不会,给写了个for循环的....好蠢)
8、写正则表达式(忘了)
9、对list有什么常用操作
10、python with语句是啥,单下划线/双下划线(不会)
面试官认为python没指针,写代码好像不自然,所以以下都没写代码:
11、单向链表判断是否成环(左神书P62)
12、二叉树前序、中序遍历还原树(很常见)
13、0.7概率生成1、0.3概率生成0的随机数生成器和0.3概率生成1、0.7概率生成0的随机数生成器,用任意个组合成为0.5、0.5概率生成1、0的随机数生成器(我说用俩,生成11或者00则对应1和0,生成01或10就continue,感觉不优雅...)
14、字符串如‘abcDefG’,如何把小写的放前面,大写的放后面,相互间顺序不变,即‘abcefDG’,要求不能额外申请空间(没想出来,主要难点就是想办法如何交换)
15、上一题提醒:有两个数字a和b,如何交换a和b的值,要求不能申请额外空间(异或,左神书P317,问我python怎么异或两个数可以直接异或吗,我说^,这个我试过可行)
16、讲堆排序的过程。建堆,调整等。
二面
1、讲项目、特征工程的细节
2、讲xgboost和gbdt区别
3、n人参加0-100分的考试,确定排名n/2的人几分(桶排序)
4、一个输入流,一直不断输出一个数字,随时可能停止,停止时要求立即输出一个之前所有数中的随机数,即每个数字输出的概率都相同,要求是只能申请常数大小的存储空间,不能O(n)大小。(一直在瞎想哈希,实际上要以概率问题来考虑这个题,即新来的数以1/n概率保留,原来的数以(n-1)/n概率保留。每次来一个数按概率抛弃一个数,剩一个数)
5、然后是上一题停止时要求输出K个数字的方案。(差不多的方法,新来的数k/n概率保留)
6、为什么很多实践或论文中,训练时要分为train、validation、test三部分,分成train、validation不就够了吗?(没说好,我感觉还是测试预测效果,实际上一般k-fold也就是train、validation啊...大佬可以说说)