时间:2016.8.4
岗位:数据挖掘实习生
部门:系统部
简介:面试主要围绕项目,数据挖掘算法,java的一些特性,以及周边python, linux等的了解程度。整个过程面试官非常nice,气氛很融洽。
一:自我介绍
二:针对项目,问一些细节,主要包括,这个项目主要是干什么的,你在里面负责了什么,要能把具体过程说清楚。然后里面涉及的具体技术点要懂得原理。
三:数据挖掘算法,其实这块主要和项目结合起来问的。主要从经典的几大算法,比如:
- SVM,说明它的详细原理,主要从分类平面,到求两类间的最大间隔,到转化为求间隔分之一,等优化问题,然后就是优化问题的解决办法,首先是用拉格拉日乘子把约束优化转化为无约束优化,对各个变量求导令其为零,得到的式子带入拉格朗日式子从而转化为对偶问题, 最后再利用SMO(序列最小优化)来解决这个对偶问题。说明它与其他分类器对比的优缺点,它的速度等等。
- logistic回归,原理,它是怎么从回归到分类的,它的优缺点,能不能处理非线性分类,与SVM对比有什么优缺点。
- 贝叶斯分类,这是一类分类方法,主要代表是朴素贝叶斯,朴素贝叶斯的原理,重点在假设各个属性类条件独立。然后能根据贝叶斯公式具体推导。考察给你一个问题,如何利用朴素贝叶斯分类去分类,比如:给你一个人的特征,判断是男是女,比如身高,体重,头发长度等特征的的数据,那