2019 暑期实习面试及准备资料总结
18年年初开始转型做ML/DL,0基础,3个月学习了基础知识,打了一个kaggle比赛(DSB2018),截止投简历的时候成绩top 3%,投了三家的算法岗 今日头条图像算法岗,蚂蚁金服机器学习推荐算法,腾讯SNG图像算法,最终拿到蚂蚁金服的offer
问题总结及资料链接
(1)机器学习部分
1 逻辑回归部分
常问,推导要会
推导:https://zhuanlan.zhihu.com/p/34325602
2 SVM部分
常问,推导要会,精简版看下面链接,但是写的不是很详细,最好把cs229讲义好好看看
推导:https://www.zhihu.com/question/21094489 @靠靠靠谱 的回答
3 集成学习
常问,推导要会
bagging方法:看周志华教授的西瓜书
boosting方法:看李航的蓝书,特别的对于GBDT,这篇文章写的很清晰,推导相对简单
stacking方法:没有特别好的讲解,都看看吧,这篇还行
决策树:cart树是最常问的,详见李航蓝书,从推导到剪枝都要会
4 softmax
这个相对简单,这篇足够了
5 牛顿法和梯度下降
推导以及优劣比较,相对简单,直接看cs229讲义
6 交叉验证
相对简单,看这篇
7 正则方法
正则是一大块,原理方法都要懂,可以参考这些文章 :1 2
8 归一化方法
基础问题,随便那本书都有
9 SVD分解 PCA ICA 白化
这部分我没有被问到,但是应该会问,毕竟是重点,看cs229讲义
(2)深度学习部分
1 过拟合的起因,怎么解决
这个没啥好说的,任何讲深度学习的书和课程都有,看哪个都行
2 batch normalization
这个问题下的回答很有价值
3 cnn rnn本质
这篇文章总结的很好
4 梯度弥散/爆炸
没有太好的文章,看看这篇讲resnet的吧
5 激活函数,比较
sigmod tanh relu maxout… 好多,这个随便一搜就一堆,放一个不太切题的文章吧,我偶像何之源奆佬的回答,手动滑稽
6 梯度下降优化
这就很多了,lan大神的花书讲的就很好,博客也可以看这个
7 各种网络结构
这个就太多了,cnn的 rnn的,细分还有很多,多看多熟悉吧
(3)传统算法
很奇怪,反而这块很不重视,考的题都很简单
1 阿里在线编程测试
给一个圆,切成n个扇形,涂m种颜色,要求任意两个相邻扇形颜色不同
思路:首先不考虑首尾位置的扇形是否颜色相同,那么总共是 m∗(m−1)