数据挖掘——学习笔记(系统聚类法和K均值聚类法)

本文详细介绍了系统聚类法的基本思想和距离计算准则,包括最短距离法、最长距离法等。同时,文章阐述了k均值算法的步骤、优化目标和初始聚类中心的选取,以及聚类结果的评价方法。通过对不同距离计算准则的探讨,展示了数据挖掘中聚类分析的关键点。
摘要由CSDN通过智能技术生成

一.系统聚类法

 

1.基本思想

将模式样本按距离准则逐步分类,类别由多到少,直到获得合适的分类要求为止。

算法:

第一步:设初始模式样本共有N个,每个样本自成一类,即建立N类,。计算各类之间的距离(初始时即为各样本间的距离),得到一个N*N维的距离矩阵D(0)。这里,标号(0)表示聚类开始运算前的状态。

第二步:假设前一步聚类运算中已求得距离矩阵D(n),n为逐次聚类合并的次数,则求D(n)中的最小元素。如果它是Gi(n)和Gj(n)两类之间的距离,则将Gi(n)和Gj(n)两类合并为一类,由此建立新的分类:

第三步:计算合并后新类别之间的距离,得D(n+1)

计算与其它没有发生合并的之间的距离,可采用多种不同的距离计算准则进行计算。

第四步:返回第二步,重复计算及合并,直到得到满意的分类结果。(如:达到所需的聚类数目,或D(n)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值