此文章是本人结合课程内容和网上资料整理,难免有误差,仅供参考。
1、下面哪种距离度量方法为欧几里得距离( )
2、以下哪个算法将两个簇的邻近度定义为不同簇的所有点对的平均逐对邻近度,它是一种凝聚层次聚类技术( )
AMIN(单链)
BMAX(全链)
C 组平均
DWard方法
3、关于混合模型聚类算法的优缺点,下面说法正确的是( )
A当簇只包含少量数据点,或者数据点近似协线性时,混合模型也能很好地处理
B混合模型比K均值或模糊c均值更一般,因为它可以使用各种类型的分布
C混合模型很难发现不同大小和椭球形状的簇
D混合模型在有噪声和离群点时不会存在问题
4、下列说法正确的是( )
A聚类是物理或抽象对象的集合分组成为多个类或簇(cluster)的过程;
B聚类中不同簇中的对象差别较小;
C聚类和分类要划分的类是未知的;
D聚类是一种无指导学习,属于观察式学习,分类则属于有指导的学习,是示例式学习;
5、聚类质量评估的主要任务包括( )
A估计聚类趋势 ;
B确定簇数;
C 确定层次结构 ;
D确定聚类质量
6、数据的哪些特性对聚类分析具有很强的影响( )
A高维性;
B规模;
C稀疏性;
D噪声和离群点
7、 在通过相似度矩阵评估簇时,如果相似度矩阵是块对角的,说明具有明显分离的簇。正确
8、SSE在无监督的簇评估中能起到很好的作用。正确
9、判断簇的个数不属于簇评估。错误
10、在聚类分析当中,簇内的相似性越大,簇将的差别越大,聚类的效果就越差。错误
11、K均值是一种产生划分聚类的基于密度的聚类算法,簇的个数由算法自动地确定。错误 是基于划分的
12、分裂层次聚类和凝聚层次聚类可以对已经做出的划分决策进行回溯,聚类之间可以交换对象。错误 分层都不能撤销
13、一种正确选择簇数的启发式方法是使用簇内方差和关于簇数曲线的拐点。正确
14、基于密度的聚类方法可以发现任意形状的簇。正确
15、以下哪个算法是分类算法( )
A DBSCAN
BC4.5
CK-Mean
DEM
16、以下哪个聚类算法不属于基于网格的聚类算法( )
ASTING
B CLIQUE
CMAFIA
DBIRCH
17、DIANA算法中,定义两个数据点之间的平均距离的为( )
A簇的直径;
B平均相异度;
C欧几里得距离;
D范式距离;
18、下列属于聚类分析方法的是( )
A 基于层次的聚类方法;
B基于划分的聚类方法;
C基于密度的聚类方法;
D基于网格的聚类方法
19、聚类分析中最常用的距离有( )
A切比雪夫距离;
B欧几里得距离;
C曼哈顿距离;
D闵可夫斯基距离
20、基于 _划分___ 的聚类方法是基于距离判断数据对象相似度的聚类。
21、层次聚类方法通过将数据对象组织成若干组形成一个相应的树进行聚类,可分为 _凝聚___ 和 __分裂__ 层次聚类
网上叫法很多,以课件为准
22、DBSCAN算法能够很好的区分原始数据的形状,但受限于用户指定的参数。正确
23、DBSCAN会把所有点划分到各自的簇中。错
24、 K-中心点算法采用簇中对象的平均值作为参考点。错
25、DIANA算法中平均相异度指两个数据点之间的平均距离。对
26、若一个对象不属于任何簇,那么该对象是基于聚类的离群点。对
27、同一种层次的聚类方法,选定的类间距度量不同,聚类的次序和结果也可能不同。对
28、 STING算法是一种基于网格的多分辨率聚类技术。对
29、同一层次的聚类方法,选定的类间距度量不同,聚类的结果可能相同也可能不同。对
出题是随机算法,可以看出来,人工智能出错也是很正常的
30、层次聚类仅局限与基于距离,不能基于密度或空间。错