k-modes聚类算法及python代码实现

K-modes介绍

k-modes是聚类算法的一种,其主要用于处理离散型的数据,是用来解决k-means处理离散型数据问题的一个优化算法。

算法思想

假设有N个样本,要将其分为三类

  1. 从N个样本中随便选取三个样本作为聚类中心。
  2. 计算N个样本中每个样本到每个聚类中心的汉明距离
    a. 汉明距离:两个样本中相同属性但不同值的个数和,比如a = [1,2,3,4] b = [1,3,6,4] 这里汉明距离为2,因为a[1] !=b[1] a[2] != b[2]
  3. 将每个样本划分到距离最小的聚类中心,组成三个类别
  4. 重新选取聚类中心,每个簇中,每一个属性的众数,将组成新的聚类中心。
  5. 重复2,3,4步骤,直到每个簇中样本到本簇中心的汉明距离总和不在减少,那么聚类结束,得到的三个类别为结构

python代码实现

import numpy as np

if __name__ == '__main__':
    # kmodes思想:
    # 1.随机选取k个初始中心点;
    # 2.针对数据集中的每个样本点,计算样本点与k个中心点的距离(这边计算的是汉明距离,为两个样本点不同的属性取值的个数),将样本点划分到离它最近的中心点所对应的类别中;
    # 3.类别划分完成后,重新确定类别的中心点,将类别中所有样本各特征的众数作为新的中心点对应特征的取值,即该类
  • 1
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值