python数据分析期末测验,python数据分析基础题库

Night368171

于 2023-12-13 16:28:44 发布

阅读量206

点赞数

文章标签： gulp

本文链接：https://blog.csdn.net/Night368/article/details/134975629

版权

本篇文章给大家谈谈python数据分析与应用选择题答案，以及python数据分析与应用课后题，希望对各位有所帮助，不要忘了收藏本站喔。

一

二

三

四

五

六

七

八

九

十

总成绩

复核

得分

阅卷教师

名

姓

班

级

业

专

院

学

院

学

科

息

信

与

学

数

题

试

考

末

期

学

季

春

年

学

一

320

数据挖掘试卷

课程代码：

C0204413

课程：

数据挖掘

卷

一、

判断题(每题

分，

分)

从点作为个体簇开始，每一步合并两个最接近的簇，这是一种分裂的层次聚类方法。

()

数据挖掘的目标不在于数据采集策略，而在于对已经存在的数据进行模式的发掘python建议自学吗。

()

在聚类分析当中，簇内的相似性越大，簇间的差别越大，聚类的效果就越差。

()

当两个点之间的邻近度取它们之间距离的平方时，

Ward

方法与组平均非常相似。()

DBSCAN

是相对抗噪声的，并且能够处理任意形状和大小的簇。

()

属性的性质不必与用来度量他的值的性质相同。

()

全链对噪声点和离群点很敏感。

()

对于非对称的属性，只有非零值才是重要的。

()

均值可以很好的处理不同密度的数据。

()

10.

单链技术擅长处理椭圆形状的簇。

()

二、

选择题(每题

分，

分)

当不知道数据所带标签时，可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分

离？

()

分类

聚类

关联分析

主成分分析

()将两个簇的邻近度定义为不同簇的所有点对邻近度的平均值，它是一种凝聚层次聚类技术。

MIN

(单链

)

B.MAX

(全链

)

组平均

D.Ward

方法

数据挖掘的经典案例“啤酒与尿布试验”最

主要是应用了

()

数据挖掘方法。

分类

预测

关联规则分析

聚类

关于

均值和

DBSCAN

的比较，以下说法不正确的是

()

均值丢弃被它识别为噪声的对象，而

DBSCAN

—般聚类所有对

象。

均值使用簇的基于原型的概念，

DBSCAN

使用基于密度的概念。

均值很难处理非球形的簇和不同大小的簇，

DBSCAN

可以处理不同大小和不同形状的簇

均值可以发现不是明显分离的簇，即便簇有重叠也可以发现，但是

DBSCAN

会合并有重叠的簇

下列关于

Ward 'Method

说法错误的是：

()

对噪声点和离群点敏感度比较小

擅长处理球状的簇

对于

Ward

方法，两个簇的邻近度定义为两个簇合并时导致的平方误差

当两个点之间的邻近度取它们之间距离的平方时，

Ward

方法与组平均非常相似

下列关于层次聚类存在的问题说法正确的是：

()

具有全局优化目标函数

Group Average

擅长处理球状的簇

可以处理不同大小簇的能力

Max

对噪声点和离群点很敏感

下列关于凝聚层次聚类的说法中，说法错误的事：

()

一旦两个簇合并，该操作就不能撤销

算法的终止条件是仅剩下一个簇

空间复杂度为

O m

具有全局优化目标函数

规则｛牛奶，尿布｝

｛啤酒｝的支持度和置信度分别为：

()

Night368171

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
python数据分析期末测验,python数据分析基础题库

()将两个簇的邻近度定义为不同簇的所有点对邻近度的平均值，它是一种凝聚层次聚类技术。从点作为个体簇开始，每一步合并两个最接近的簇，这是一种分裂的层次聚类方法。数据挖掘的目标不在于数据采集策略，而在于对已经存在的数据进行模式的发掘。在聚类分析当中，簇内的相似性越大，簇间的差别越大，聚类的效果就越差。方法，两个簇的邻近度定义为两个簇合并时导致的平方误差。当两个点之间的邻近度取它们之间距离的平方时，属性的性质不必与用来度量他的值的性质相同。均值很难处理非球形的簇和不同大小的簇，均值可以很好的处理不同密度的数据。
复制链接

扫一扫