数据挖掘——学习笔记（系统聚类法和K均值聚类法）

最新推荐文章于 2024-02-21 20:57:30 发布

dews27368

最新推荐文章于 2024-02-21 20:57:30 发布

阅读量1.9k

点赞数 1

文章标签：数据结构与算法

原文链接：http://www.cnblogs.com/yangmier/archive/2012/04/09/2438447.html

版权

本文详细介绍了系统聚类法的基本思想和距离计算准则，包括最短距离法、最长距离法等。同时，文章阐述了k均值算法的步骤、优化目标和初始聚类中心的选取，以及聚类结果的评价方法。通过对不同距离计算准则的探讨，展示了数据挖掘中聚类分析的关键点。

摘要由CSDN通过智能技术生成

一.系统聚类法

1.基本思想

将模式样本按距离准则逐步分类，类别由多到少，直到获得合适的分类要求为止。

算法：

第一步：设初始模式样本共有N个，每个样本自成一类，即建立N类， $G_{1}^{(0)},G_{2}^{(0)},...,G_{n}^{(0)}$ 。计算各类之间的距离（初始时即为各样本间的距离），得到一个N*N维的距离矩阵D⁽⁰⁾。这里，标号(0)表示聚类开始运算前的状态。

第二步：假设前一步聚类运算中已求得距离矩阵D⁽ⁿ⁾，n为逐次聚类合并的次数，则求D⁽ⁿ⁾中的最小元素。如果它是G_i⁽ⁿ⁾和G_j⁽ⁿ⁾两类之间的距离，则将G_i⁽ⁿ⁾和G_j⁽ⁿ⁾两类合并为一类 $G_{ij}^{(n+1)}$ ，由此建立新的分类： $G_{1}^{(n+1)},G_{2}^{(n+1)},...,G_{l}^{(n+1)}$ 。

第三步：计算合并后新类别之间的距离，得D⁽ⁿ⁺¹⁾。

计算 $G_{ij}^{(n+1)}$ 与其它没有发生合并的 $G_{1}^{(n+1)},G_{2}^{(n+1)},...,G_{l}^{(n+1)}$ 之间的距离，可采用多种不同的距离计算准则进行计算。

第四步：返回第二步，重复计算及合并，直到得到满意的分类结果。（如：达到所需的聚类数目，或D⁽ⁿ⁾

最低0.47元/天解锁文章

关注

1
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。