- CVTE-数据挖掘组
一面(8.20):
- 自我介绍一下,简单的说一下在校的项目和所学的课程。
- 怎么看待数据挖掘?为什么要进行数据挖掘?
- 数据挖掘过程是什么?
- 介绍自己的论文工作...
- 数据处理过程中:正态分布数据补全方式有中值和均值,各有什么异同,为什么要采用后者?
- 特征选择中,相关性分析是分析什么之间的相关性?什么原理?特征和ground truth的线性表的斜率和相关性大小有关系吗?
- 逐步回归原理,以及采用什么检验方法?T检验和F检验异同。
- Boosting和Bagging原理,比较不同。Boosting对样本根据误差重加权在整个结果上体现在哪里(损失函数最小)?RF原理及其与Bagging的不同。
- 对数据挖掘组哪些方向比较感兴趣,为什么?
- 有什么想问的?
二面(8.21):
- 做个简短的自我介绍。
- 讲讲投会议的论文内容。
- 模型选的什么分类器?有没有对比算法?为什么选择SVM?为什么不用深度网络做实验(样本量有限)?
- 推导SVM,为什么采用拉格朗日乘子法?
- SVM优缺点,为什么会对缺失值敏感?
- 有哪些核函数?分别适用于什么场景