本篇文章给大家谈谈python数据分析与应用选择题答案,以及python数据分析与应用课后题,希望对各位有所帮助,不要忘了收藏本站喔。
一
-
-
二
二
三
四
五
六
七
八
九
十
总成绩
复核
得分
阅卷教师
:
名
姓
班
级
业
专
院
学
院
学
学
科
息
信
与
学
数
题
试
试
考
末
期
期
学
季
春
年
学
一
320
数据挖掘试卷
课程代码:
C0204413
课程:
数据挖掘
A
卷
一、
判断题(每题
1
分,
10
分)
1.
从点作为个体簇开始,每一步合并两个最接近的簇,这是一种分裂的层次聚类方法。
()
2.
数据挖掘的目标不在于数据采集策略,而在于对已经存在的数据进行模式的发掘python建议自学吗。
()
3.
在聚类分析当中,簇内的相似性越大,簇间的差别越大,聚类的效果就越差。
()
4.
当两个点之间的邻近度取它们之间距离的平方时,
Ward
方法与组平均非常相似。()
5.
DBSCAN
是相对抗噪声的,并且能够处理任意形状和大小的簇。
()
6.
属性的性质不必与用来度量他的值的性质相同。
()
7.
全链对噪声点和离群点很敏感。
()
8.
对于非对称的属性,只有非零值才是重要的。
()
9.
K
均值可以很好的处理不同密度的数据。
()
10.
单链技术擅长处理椭圆形状的簇。
()
二、
选择题(每题
2
分,
30
分)
1.
当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分
离?
()
A.
分类
B.
聚类
C.
关联分析
D.
主成分分析
2.
()将两个簇的邻近度定义为不同簇的所有点对邻近度的平均值,它是一种凝聚层次聚类技术。
A.
MIN
(单链
)
B.MAX
(全链
)
C.
组平均
D.Ward
方法
3.
数据挖掘的经典案例“啤酒与尿布试验”最
主要是应用了
()
数据挖掘方法。
A
分类
B
预测
C
关联规则分析
D
聚类
4.
关于
K
均值和
DBSCAN
的比较,以下说法不正确的是
()
A.
K
均值丢弃被它识别为噪声的对象,而
DBSCAN
—般聚类所有对
象。
B.
K
均值使用簇的基于原型的概念,
DBSCAN
使用基于密度的概念。
C.
K
均值很难处理非球形的簇和不同大小的簇,
DBSCAN
可以处理不同大小和不同形状的簇
D.
K
均值可以发现不是明显分离的簇,即便簇有重叠也可以发现,但是
DBSCAN
会合并有重叠的簇
5.
下列关于
Ward 'Method
说法错误的是:
()
A.
对噪声点和离群点敏感度比较小
B.
擅长处理球状的簇
C.
对于
Ward
方法,两个簇的邻近度定义为两个簇合并时导致的平方误差
D.
当两个点之间的邻近度取它们之间距离的平方时,
Ward
方法与组平均非常相似
6.
下列关于层次聚类存在的问题说法正确的是:
()
A.
具有全局优化目标函数
B.
Group Average
擅长处理球状的簇
C.
可以处理不同大小簇的能力
D.
Max
对噪声点和离群点很敏感
7.
下列关于凝聚层次聚类的说法中,说法错误的事:
()
A.
一旦两个簇合并,该操作就不能撤销
B.
算法的终止条件是仅剩下一个簇
2
C.
空间复杂度为
O m
D.
具有全局优化目标函数
8
规则{牛奶,尿布}
T
{啤酒}的支持度和置信度分别为:
()