【Python学习笔记】11:带散点图的k-means算法

带散点图的k-means算法

先安装好matplotlib包,用pip安装就可以。

import math
import random
f=open("dataforkmeans - .txt")
a=[]
b=[]
tag=1  
for k in f.read().split():  
    if tag==1:  
        a.append(float(k))  
        tag=0  
    else:  
        b.append(float(k))  
        tag=1  
#到此已经将x坐标和y坐标分别放在了a[]和b[]中  
  
p=len(a)  
k=4  
print ("数据表的长度为",p,"已知聚类数k =",k)
center=[]  
for i in range(k):  
    while(1):  
        j=random.randint(0,p-1)  
        if j not in center:  
            center+=[j]  
            break  
#到此已经选取了四个0~104的不重复下标  
cen_x=[a[i] for i in center]#存放种子点横坐标  
cen_y=[b[i] for i in center]#存放种子点纵坐标  
  
belong=[-1 for i in range(p)]  
#print belong  
tag=1  
count=0  
while(tag==1):#tag==1表示在循环里进行过种子点的移动  
    tag=0  
    #先更新聚类belong[]  
    for i in range(p):#对每一个点  
        index_maxlen=-1#存放到谁最近  
        maxlen=-1#存放最近距离  
        for j in range(k):#对k个种子点  
            numlen=(a[i]-cen_x[j])**2+(b[i]-cen_y[j])**2#存放当前距离  
            if maxlen<0 or numlen<maxlen:#如果比maxlen小  
                index_maxlen=j#记录种子下标  
                maxlen=numlen#更新更小值  
        belong[i]=index_maxlen#记录它的种子点下标  
    #再移动种子点  
    sum_x=[0 for i in range(4)]  
    sum_y=[0 for i in range(4)]#分别保存k个种子点对应聚类的横纵坐标和  
    numofclass=[0 for i in range(4)]#用来保存k个聚类的点数  
    for i in range(p):#对每一个点  
        sum_x[belong[i]]+=a[i]  
        sum_y[belong[i]]+=b[i]#将横纵坐标加到它的聚类中去  
        numofclass[belong[i]]+=1#维护聚类的点数  
    for i in range(k):#对k个种子点  
        if sum_x[i]/numofclass[i] !=cen_x[i]:  
            tag=1  
            cen_x[i]=sum_x[i]/numofclass[i]  
        if sum_y[i]/numofclass[i] !=cen_y[i]:  
            tag=1  
            cen_y[i]=sum_y[i]/numofclass[i]  
    count+=1  


x=[[],[],[],[]]
y=[[],[],[],[]]
for i in range(k):#对k个种子点  
        for j in range(p):#对每个点  
            if belong[j]==i:#如果是第i个聚类  
                x[i].append(a[j])
                y[i].append(b[j])
import numpy
import matplotlib
import pylab as pb
for i in range(k):
    if i==0:
        pb.plot(x[i],y[i],'or')
    elif i==1:
        pb.plot(x[i],y[i],'ob')
    elif i==2:
        pb.plot(x[i],y[i],'og')
    else:
        pb.plot(x[i],y[i],'ok')
pb.show()

运行结果:


 

  • 0
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值