前言:本篇是2024年软件工程专业“数据仓库数据挖掘”限选课期末考试回忆版。太具体的题目实在是记不住了,只记得考了什么知识点。本次考试比往年题量还是少一些的。
一、简答题
数据预处理的步骤、特征处理分类、归一化的定义和公式
二、OLAP
(1)写模型(星型或者雪花);
(2)某种处理方法用到的OLAP操作;
(3)OLAP如何计算粒度;
(4)数据预计算的意义和挑战
三、关联度挖掘
(1)关联度挖掘的步骤,哪个最重要,为什么
(2)aprori:{1,2,3}{1,2,4}
(3)aprori all <1,2,3> <1,2,4>
(4)GFS {(1,2),3}{2,(3,4)}
四、决策树
(1)决策树原理
(2)给了一个数据集,写规约后的数据;
(3)决策树算法,基于给出的数据集,给了决策树让填空,然后,给了一个数据X,判断X最后的分类。
五、聚类算法
(1)BIRCH得到的结果;
(2)chameleon步骤;
(3)DIANA怎么分裂;
(4)DBSCAN判断某个点密度可达/核心密度可达
六、离群点挖掘
K最近邻距离的定义并且举例说明