数据挖掘
文章平均质量分 78
数挖
嘻嘻的妙妙屋
这个作者很懒,什么都没留下…
展开
-
数据挖掘原理与实践 第六章作业
6.1为什么离群点挖掘是重要的?答:离群点是指与大部分其它对象不同的对象,在数据的散布图中,它们远离其它数据点,其属性值显著地偏离期望的或常见的属性值。(1) 因为离群点可能是度量或执行错误所导致的,例如相对少的离群点可能扭曲一组值的均值和标准差,或者改变聚类算法产生的簇的集合。(2) 因为离群点本身可能是非常重要的,隐藏着重要的信息,在欺诈检测,入侵检测等方面有着广泛的应用。所以离群点挖掘是非常重要的。6.3许多用于离群点检测的统计检验方法是在这样一种环境下开发的:数百个观测就是一个大数据原创 2021-06-01 15:03:20 · 1234 阅读 · 0 评论 -
数据挖掘原理与实践 第五章作业
P1705.1列举关联规则在不同领域中应用的实例。答:在医学领域:发现某些症状与某种疾病之间的关联,为医生进行疾病诊断和治疗提供线索;在商业领域:发现商品间的联系,为商场进行商品促销及摆放货架提供辅助决策信息;在地球科学领域:揭示海洋、陆地和大气过程之间的关系。5.2给出如下几种类型的关联规则的例子,并说明它们是否是有价值的。(1) 高支持度和高置信度的规则。(2) 高支持度和低置信度的规则。(3) 低支持度和低置信度的规则。(4) 低支持度和高置信度的规则。答: (1) 如牛奶&原创 2021-06-01 11:03:12 · 3068 阅读 · 0 评论 -
数据挖掘原理与实践 第四章作业
P1474.2假设数据挖掘的任务是将如下的8个点(用 (x,y) 代表位置)聚类为三个簇:A1 (2,10),A2(2,5),A3(8,4),B1(5,8),B2(7,5),B3(6,4),C1(1,2),C2(4,9)。距离函数是 Euclidean 函数。假设初始我们选择 A1、B1 和 C1 为每个簇的中心,用 k-means 算法来给出。(1) 在第一次循环执行后的三个簇中心。(2) 最后的三个簇中心及簇包含的对象。Euclidean 为欧式距离,该距离公式如下:初始选择A1、B1和C原创 2021-05-31 13:17:44 · 14548 阅读 · 2 评论