我的kmeans聚类 python代码

仿制matlab的kmeans聚类 http://blog.csdn.net/nbu2004/article/details/43084999注意 data 是list类型,但二维array类型也没问题。比起MATLAB,Python只能更简单,即使没有MATLAB矩阵表达式。
# -*- coding: utf-8 -*-

# import copy

import numpy as  np
import numpy.linalg as LA

def kmeans(data, K, dist=lambda x,y: LA.norm(x-y), tol=1e-8):
    '''
    arguments:
    data: list of data
    K: int, numbers of classes
    dist: distance

    return: kls, ctr
        example:'''

    ctr = data[:K]
    N = len(data)
    while True:
        # Assignment step
        kls = [[] for _ in range(K)]                # K clusters
        for dt in data:
            d = dist(dt, ctr[0])
            ind = 0
            for k, ck in enumerate(ctr[1:], 1):
                d0 = dist(dt, ck)
                if d0 < d:
                    ind = k
                    d = d0

            kls[ind].append(dt)   # data l is in ind-th cluster
        
        # Update step
        S = 0
        newctr = []
        for k in range(K):                     # calculate new centroids
            ck = np.mean(np.array(kls[k]), 0)
            S += dist(ck, ctr[k])
            newctr.append(ck)           
        if S <= tol:
            break
        else:
            ctr = newctr                   # update the centroids

    return kls, ctr


# test
data = np.random.rand(100,2)
K = 4
kls, ctr = kmeans(data, K)
clr=['r','k','g','b']
import matplotlib.pyplot as plt
for k in range(K):
    for kk in kls[k]:
        plt.plot(kk[0], kk[1], clr[k]+'o')
    plt.plot(ctr[k][0], ctr[k][1], clr[k]+'+')
plt.show()
 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值