经常会问到的问题,经典算法推导(加分项),原理,各个损失函数之间区别,使用场景,如何并行化,有哪些关键参数
比如LR(并行算法的几种优化方法经常被问到),FFM,SVM,RF,KNN,EM,Adaboost,PageRank,GBDT,Xgboost,HMM,DNN,CNN,RNN,LSTM,推荐算法,聚类算法,图像,自然语言,等等机器学习领域的算法,这些基本都会被问到
XGB和GBDT区别与联系也会经常问到:https://www.zhihu.com/question/41354392/answer/128008021?group_id=773629156532445184
一些评估函数,F值,mae,logloss,AUC,MAP@N,特别是AUC是如何计算的,给个链接:
https://mp.weixin.qq.com/s?__biz=MzI4MTE1MzQwMg==&mid=404000626&idx=1&sn=71dbbfd48ec28f909ed84adb542e1216#rd
有个容易进坑的问题,树模型中被分裂过的特征还会不会再次被选中作为分裂节点。很明显是有可能被选中的,每次计算信息增益都是对剩下的样本来做计算的,这个时候用过的特征再次计算不同的分列点可能增益还会排在前面。
哪些优化方法,随机梯度下降,牛顿拟牛顿原理
生成模型,判别模型线性分类和非线性分类各有哪些模型
SVM核技巧原理,如何选择核函数
特征选择方法有哪些
常见融合框架原理,优缺点,bagging,stacking,boosting,为什么融合能提升效果
信息熵和基尼指数的关系(信息熵在x=1处一阶泰勒展开就是基尼指数)
如何克服过拟合,欠拟合
L0,L1,L2正则化(如果能推导绝对是加分项,能画个等高线是最基本的,L0是NP问题)
模型性能=方差+偏差+噪声
方差:训练集error低,验证集error高
偏差:训练集验证集error都高
另外可以报一下小象学院的机器学习班,等到开团的时候报也就300左右,讲的挺不错的,有算法推导和代码实现,我也是看了之后才明白很多算法的原理
还会问一些常见的数据结构和算法,写代码的题基本都是出自《剑指offer》和《微软面试100题》,只要刷几遍,代码题这里搞定也是加分项
其余的基本就是问问比赛,项目,遇到的问题,如何解决,在团队中的角色,评价自己
面试官问你还有问题要问没,就别瞎问了吧,多看看别人的面经
比如问点现在这个部门做的业务,遇到过的问题,部门发展的一个规划
最好别叫面试官评价你,要是评价不好会影响心情,自己的面试表现自己应该清楚
可以在自己面试的时候做记录,经常复习,先从小公司面起,积累经验
另外要定位准确,自己的水平自己清楚,不要死磕大公司,浪费了大量时间还经常1面被刷
没事审视下自己的简历,不要把自己不熟悉的东西写上去,像什么精通之类的建议改成了解吧……不然会被问哭的
不要装逼写2页,我很多项目比赛都没写进去,只写了几个名次靠前的比赛,能吹一点的项目,其他没写进去的可以找机会主动说出来
项目即使很水,也要吹的很难很厉害的样子
比赛和项目尽量突出里面的难点,自己做的贡献
算法的推导同样重要,之前我也是看到那些公式就蛋疼,后面没办法,看书看视频,多手推几遍,这样面试的时候更有底气
个人觉得在面试的时候能手推算法的应该比较少,所以优势是很大的
实习生面试BAT跪掉的原因就是没有复习,对算法的原理了解不够深入,所以在校招的时候,9月开始用了将近一个月的时间来复习,效果挺好。
建议多交一些牛逼的朋友,我们有个群,6个人,有4个百度offer,有3个腾讯offer,还有个研二估计是下一个阿里星吧(一年前的预测成真了,wepon真的拿到阿里星了……)
10.9号,我们群里终于有一个阿里了,终于集齐了bat,可以召唤单挑之王了……他就是天音大魔王
我们经常一起打比赛,在群里讨论学术,装逼扯淡什么的,今年只要参加了的比赛,基本都拿奖了吧
另外感觉大公司也并没有学校歧视,我的学校211都不是,问都没问过学校的问题
我本科是个学渣,找不到工作就考研,读研开始写代码,所以两年,可以改变很多事情
下面是我准备面试整理的一些资料,里面有很多算法以及面试问题
http://download.csdn.net/detail/bryan__/9640531
http://blog.csdn.net/v_july_v/article/details/6543438
http://blog.csdn.net/hackbuteer1
机器学习公开课
https://www.julyedu.com/video/play/18/10
面试算法资料
http://www.cnblogs.com/tornadomeet/p/3395593.html
机器学习知识点总结
https://bbs.aliyun.com/read.php?spm=5176.100258.100258.8.bhrQ8k&tid=294564&displayMode=1&page=1&toread=1#tpc
http://m.blog.csdn.net/article/details?id=50244695
面试编程题十大经典算法
http://mp.weixin.qq.com/s?__biz=MjM5Nzk2MDU5NA==&mid=2652545706&idx=3&sn=87e964154fa54999719c34c4b67dfff7&scene=0#wechat_redirect
知乎上的问题,如何准备机器学习工程师的面试,非常全,多往后面翻,收获会很多
https://www.zhihu.com/question/23259302
如何判断深度学习面试者水平
https://www.zhihu.com/question/41233373
转载自:http://blog.csdn.net/bryan__/article/details/52672912