超星雅尔数据挖掘基础B第十一讲无标签的数据分析算法

1【单选题】当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?( )
A、分类
B、聚类
C、关联分析
D、主成分分析
正确答案: B

2【单选题】下列关于层次聚类存在的问题说法正确的是( )
A、具有全局优化目标函数
B、Group Average擅长处理球状的簇
C、可以处理不同大小簇的能力
D、Max对噪声点和离群点很敏感
正确答案: B

3【单选题】规则{牛奶,尿布}→{啤酒}的支持度和置信度分别为( )
在这里插入图片描述
A、0.4,0.4
B、0.67,0.67
C、0.4,0.67
D、0.67,0.4
正确答案: C

4【单选题】下列( )是属于分裂层次聚类的方法。
A、Min
B、Max
C、Group Average
D、MST
正确答案: D

5【单选题】( )是两个簇的邻近度定义为不同簇的所有点对邻近度的平均值。
A、堆平均B、图平均C、数平均D、组平均正确答案: D

6【单选题】相似度矩阵可以用相识度表示还可以用( )表示。
A、时间
B、距离
C、空间
D、维度
正确答案: B

7【单选题】数据挖掘的经典案例“啤酒与尿布试验”最主要是应用了( )数据挖掘方法。
A、分类B、预测
C、关联规则分析
D、聚类
正确答案: C

8【单选题】简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰在一个子集中,这种聚类类型称作( )
A、层次聚类
B、划分聚类
C、非互斥聚类
D、模糊聚类
正确答案: B

9【单选题】在基本K均值算法里,当邻近度函数采用( )的时候,合适的质心是簇中各点的中位数。
A、曼哈顿距离
B、欧几里德距离
C、余弦距离
D、Bregman散度
正确答案: A

10【单选题】BIRCH是一种( )
A、分类器
B、聚类算法
C、关联分析算法
D、特征选择算法
正确答案: B

11【多选题】( )这些数据特性都是对聚类分析具有很强影响的。
A、高维性
B、规模
C、稀疏性
D、噪声和离群点
正确答案: ABCD

12【多选题】以下属于聚类算法的有( )
A、K-Means
B、DBSCAN
C、Apriori
D、KNN
正确答案: AB

13【多选题】常见的距离度量方法包括( )
A、欧氏距离
B、汉明距离
C、曼哈顿距离
D、切比雪夫距离
正确答案: ABCD

14【多选题】属性包括的四种类型标称和( )
A、序数
B、区间
C、比率
D、斜率
正确答案: ABC

15【多选题】组平均是一种界于( )之间的折中方法。
A、单链
B、全链
C、单表
D、全表
正确答案: AB

16【判断题】从点作为个体簇开始,每一步合并两个最接近的簇,这是一种分裂的层次聚类方法。
正确答案:×

17【判断题】数据挖掘的目标不在于数据采集策略,而在于对已经存在的数据进行模式的发掘。
正确答案:√

18【判断题】全链对噪声点和离群点很敏感。
正确答案:×

19【判断题】K均值可以很好的处理不同密度的数据。
正确答案:×

  • 1
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值