1、LR原理及公式推导,有哪些优化方法,梯度下降,牛顿法以及各种变种,L1、L2范数的区别,优缺点。
2、GBDT、XGBOOST原理异同,如何并行化等等(最好去xgboost官方看原始论文,讲得很清楚)随机森林原理及细节。
3、如何解决数据不均衡问题。SVM原理及细节,SVM和树模型的异同以及优缺点和局限性。
4、推荐系统,协同过滤原理,基于用户、物品等等。深度学习中的一些小问题,比如relu是什么,如何解决梯度消失等等,这个最好了解下,毕竟深度学习这么火。
5项目经历项目这块,无论是数据挖掘竞赛还是一些项目,一定要自己把整个过程梳理一下,切记一问项目就是 ”提特征,跑模型,拿第一“,需要把项目的亮点体现出来,说白了就是你这个项目为什么牛逼,你做出了哪些厉害的贡献,这个需要技巧和准备。