常用聚类算法K-means及其改进算法

本文介绍了聚类算法的基本概念,重点探讨了K-means算法的原理、评价准则、算法流程,并提供了代码实现。同时,文章还讨论了K-means的改进算法,包括K-Harmonic Means和AKHMP,旨在降低对初始点选择的依赖并优化聚类效果。
摘要由CSDN通过智能技术生成

1.聚类算法

    聚类算法是将大量数据以相似度为基础形成若干类,使类内之间的数据最为相似,类间的数据相似度差别尽可能的大,属于无监督学习。

2.K-means算法

  2.1算法原理

     K-means聚类算法以k为参数,把n个对象分为k个簇,以使簇内的具有较高的相似度,且簇间相似度低。

  2.2 评价准则

    E的计算为:E=\sum_{i=1}^k\sum_{x\epsilon C}|x-\bar{x_i}|^2,该式在一定程度上刻画了簇内样本相似度。

  2.3 算法流程及描述

    输入:簇的数目k和包含n个对象的数据库

    过程:

    任选k个对象作为初始均值向量;

    Repeat

         for j=1 to n DO

                根据簇中对象的平均值,将每个对象赋给最类似的簇

         for i=1 to k DO

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值