python 画中心点_使用python画k均值分类图

550fb8b175d184994674ac3b78b3c434.png

欢迎关注公众号:老白和他的爬虫

昨天帮小余同学用python画了下k均值分类图,原理比较简单在这里分享一下。

首先小余同学已经用spss做好了族群分类,分类结果如图所示

df4b0149bbd92ce4cedd72c60e44a3b1.png


分类结果

一共有100条结果,这里只截取了部分,今天的程序就是要用python画出这个分类图

1.明确需求

我们需要把100条记录按类别显示在坐标系中,每一个族群需要使用不同的颜色显示,并且我们还需要计算出来每一个族群的中心点,并将这个中心点与普通的点区分开来

2.写入数据

import matplotlib.pyplot as pb
import matplotlib
k=3 #一共三个族群
x=[
   [2,4,7,8,10,11,14,16,19,22,26,28,30,31,34,35,36,45,46,47,48,49,50,52,57,58,63,64,70,71,73,74,75,83,84,85,87,88,89],
   [1,3,5,6,9,12,13,15,17,18,20,21,23,24,25,27,29,32,33,37,38,39,40,42,43,51,66,67,68,69,76,81,82,86],
   [41,44,53,54,55,56,59,60,61,62,65,72,77,78,79,80,90]
   ]
y=[
   [78.75,82.5,78.75,78.25,87.75,81.75,85.25,83.75,87.25,87.75,81.25,89,85.25,80.25,85.25,89,79.25,83.75,78.25,79.25,79.25,80.25,84.25,88.75,79.25,77.25,92.5,79.25,81.25,85.75,92.5,94.5,84.75,81.75,84.25,81.75,82.75,82.25,87.75],
   [69,67.5,75.25,70.25,68.25,65.75,72.75,67.25,69.25,74.75,67.25,71.25,76.25,72.25,71.25,72.75,76.25,63.75,73.25,66.75,72.25,76.25,71.75,62.5,73.75,73.75,65.75,68.25,68.75,75.75,62.75,64,72.75,70.25],
   [54,59.5,51,54,52.25,52.25,51.25,52.25,50,50,58.75,45,52.25,53.75,43,45,53.25]
   ]

将数据写入,这里还有待改进,其实最好是选择读取excel文件,直接自动获取数值,尤其是数据量很大的时候,但我这里偷懒了,直接复制,你可以对它有一定的改进。

3.画出不同族群

#把三个族群分别用不同颜色的圆点表示出来
for i in range(k): 
    if i==0:
        pb.plot(x[i],y[i],'or')
    elif i==1:
        pb.plot(x[i],y[i],'ob')
    elif i==2:
        pb.plot(x[i],y[i],'og')

4.计算中心点

最终画出的分类图需要区别中心点,中心点需要我们自己来计算

#(xa,ya),(xb,yb),(xc,yc)分别表示三个族群的中心点,下面这段代码计算出中心点
nsum = 0 
for i in range(len(x[0])):
    nsum += x[0][i]
xa = nsum / len(x[0])

nsum = 0
for i in range(len(x[1])):
    nsum += x[1][i]
xb = nsum / len(x[1])

nsum = 0
for i in range(len(x[2])):
    nsum += x[2][i]
xc = nsum / len(x[2])

nsum = 0
for i in range(len(y[0])):
    nsum += y[0][i]
ya = nsum / len(y[0])

nsum = 0
for i in range(len(y[1])):
    nsum += y[1][i]
yb = nsum / len(y[1])

nsum = 0
for i in range(len(y[2])):
    nsum += y[2][i]
yc = nsum / len(y[2])

xd = []
for x in range(90):
    xd.append(x)
yd = []
for x in range(90):
    yd.append(77)

你看我这里代码这么长,是我又偷懒了。python本来就是很简洁的语言,不需要想我这段代码这么繁琐,这里其实我们可以封装一个函数,这个函数专门来计算平均值,这样几行就可以得到中心点,这里我计算的三个中心点分别用(xa,ya),(xb,yb),(xc,yc)表示。

计算出来之后,我们就可以画出来

#用正方形把(xa,ya),(xb,yb),(xc,yc)画出来
pb.plot(xa,ya,'or',marker="s",markersize=10)
pb.plot(xb,yb,'ob',marker="s",markersize=10)
pb.plot(xc,yc,'og',marker="s",markersize=10)

为区分出中心点,这里用正方形来表示中心点,并将点的尺寸调大。

5.添加图例说明

画出来的图我们需要添加图例说明,这样才能直白的看出每一个图例表示什么

#添加一个图例说明
myfont = matplotlib.font_manager.FontProperties(fname="DroidSansFallback.ttf")
pb.legend((u'基础级', u'提高级',u'发展级'),loc='best',prop=myfont)

因为我们是中国人,所以我们肯定经常需要用到中文字体。在这里我们要想显示中文字体,必须需要用到自己下载的中文字体,不然中文可能无法显示。我这里用到的字体是"DroidSansFallback.ttf",这里我就不帮你整理了,直接百度搜索这个文件,就能下载到。

6.小余同学的额外需求

一个合格的程序员肯定能满足产品经理的所有要求,一个合格的产品经理一定会不断的向程序员提要求。我是不是合格的程序员我不知道,小余同学一定是个合格的产品经理。图画好后,小余同学要求我加两条虚线区别族群,于是我灵机一动,就这样写

#用(xd,yd),(xe,ye)来画虚线
xd = []
for x in range(90):
    xd.append(x)
yd = []
for x in range(90):
    yd.append(77)
    
xe = []
for x in range(90):
    xe.append(x)
ye = []
for x in range(90):
    ye.append(61)
#应小余同学的要求,给族群画上一条虚线
pb.plot(xd,yd,'ok',marker='s',markersize=1)
pb.plot(xe,ye,'ok',marker='s',markersize=1)

这里的参数是根据已经画好的图像来设置的,你需要在前一步就在控制台显示图形,然后根据的大致的位置设置虚线的坐标。
小余同学的这个需求已经很简单了,她以后肯定是个心疼程序员的产品经理。

7.完整程序代码

import matplotlib.pyplot as pb
import matplotlib
k=3 #一共三个族群
x=[
   [2,4,7,8,10,11,14,16,19,22,26,28,30,31,34,35,36,45,46,47,48,49,50,52,57,58,63,64,70,71,73,74,75,83,84,85,87,88,89],
   [1,3,5,6,9,12,13,15,17,18,20,21,23,24,25,27,29,32,33,37,38,39,40,42,43,51,66,67,68,69,76,81,82,86],
   [41,44,53,54,55,56,59,60,61,62,65,72,77,78,79,80,90]
   ]
y=[
   [78.75,82.5,78.75,78.25,87.75,81.75,85.25,83.75,87.25,87.75,81.25,89,85.25,80.25,85.25,89,79.25,83.75,78.25,79.25,79.25,80.25,84.25,88.75,79.25,77.25,92.5,79.25,81.25,85.75,92.5,94.5,84.75,81.75,84.25,81.75,82.75,82.25,87.75],
   [69,67.5,75.25,70.25,68.25,65.75,72.75,67.25,69.25,74.75,67.25,71.25,76.25,72.25,71.25,72.75,76.25,63.75,73.25,66.75,72.25,76.25,71.75,62.5,73.75,73.75,65.75,68.25,68.75,75.75,62.75,64,72.75,70.25],
   [54,59.5,51,54,52.25,52.25,51.25,52.25,50,50,58.75,45,52.25,53.75,43,45,53.25]
   ]
#把三个族群分别用不同颜色的圆点表示出来
for i in range(k): 
    if i==0:
        pb.plot(x[i],y[i],'or')
    elif i==1:
        pb.plot(x[i],y[i],'ob')
    elif i==2:
        pb.plot(x[i],y[i],'og')
#(xa,ya),(xb,yb),(xc,yc)分别表示三个族群的中心点,下面这段代码计算出中心点
nsum = 0 
for i in range(len(x[0])):
    nsum += x[0][i]
xa = nsum / len(x[0])

nsum = 0
for i in range(len(x[1])):
    nsum += x[1][i]
xb = nsum / len(x[1])

nsum = 0
for i in range(len(x[2])):
    nsum += x[2][i]
xc = nsum / len(x[2])

nsum = 0
for i in range(len(y[0])):
    nsum += y[0][i]
ya = nsum / len(y[0])

nsum = 0
for i in range(len(y[1])):
    nsum += y[1][i]
yb = nsum / len(y[1])

nsum = 0
for i in range(len(y[2])):
    nsum += y[2][i]
yc = nsum / len(y[2])

xd = []
for x in range(90):
    xd.append(x)
yd = []
for x in range(90):
    yd.append(77)
    
xe = []
for x in range(90):
    xe.append(x)
ye = []
for x in range(90):
    ye.append(61)
#用正方形把(xa,ya),(xb,yb),(xc,yc)画出来
pb.plot(xa,ya,'or',marker="s",markersize=10)
pb.plot(xb,yb,'ob',marker="s",markersize=10)
pb.plot(xc,yc,'og',marker="s",markersize=10)
#应小余同学的要求,给族群画上一条虚线
pb.plot(xd,yd,'ok',marker='s',markersize=1)
pb.plot(xe,ye,'ok',marker='s',markersize=1)
#添加一个图例说明
myfont = matplotlib.font_manager.FontProperties(fname="DroidSansFallback.ttf")
pb.legend((u'基础级', u'提高级',u'发展级'),loc='best',prop=myfont)
#在控制台显示图像
pb.show()

最后画出来的分类图

e0de4e5496e248751f9193f644bdeb2b.png


结果图

这里需要说明下,这个程序写的比较草率,只是为了解决很急的需求,有很多待改进的地方。python不仅可以画出分类图,其实也可以直接来进行k均值的分类,这里因为分类小余同学用spss做了分类,所以我只要画图就好了。

已标记关键词 清除标记
表情包
插入表情
评论将由博主筛选后显示,对所有人可见 | 还能输入1000个字符
相关推荐
简介 笔者当初为了学习JAVA,收集了很多经典源码,源码难易程度分为初级、中级、高级等,详情看源码列表,需要的可以直接下载! 这些源码反映了那时那景笔者对未来的盲目,对代码的热情、执着,对IT的憧憬、向往!此时此景,笔者只专注Android、Iphone等移动平台开发,看着这些源码心中有万分感慨,写此文章纪念那时那景! Java 源码包 Applet钢琴模拟程序java源码 2个目标文件,提供基本的音乐编辑功能。编辑音乐软件的朋友,这款实例会对你有所帮助。 Calendar万年历 1个目标文件 EJB 模拟银行ATM流程及操作源代码 6个目标文件,EJB来模拟银行ATM机的流程及操作:获取系统属性,初始化JNDI,取得Home对象的引用,创建EJB对象,并将当前的计数器初始化,调用每一个EJB对象的count()方法,保证Bean正常被激活和钝化,EJB对象是用完毕,从内存中清除,从账户中取出amt,如果amt>账户余额抛出异常,一个实体Bean可以表示不同的数据实例,我们应该通过主键来判断删除哪个数据实例…… ejbCreate函数用于初始化一个EJB实例 5个目标文件,演示Address EJB的实现 ,创建一个EJB测试客户端,得到名字上下文,查询jndi名,通过强制转型得到Home接口,getInitialContext()函数返回一个经过初始化的上下文,用client的getHome()函数调用Home接口函数得到远程接口的引用,用远程接口的引用访问EJB。 EJB中JNDI的使用源码例子 1个目标文件,JNDI的使用例子,有源代码,可以下载参考,JNDI的使用,初始化Context,它是连接JNDI树的起始点,查找你要的对象,打印找到的对象,关闭Context…… ftp文件传输 2个目标文件,FTP的目标是:(1)提高文件的共享性(计算机程序和/或数据),(2)鼓励间接地(通过程序)使用远程计算机,(3)保护用户因主机之间的文件存储系统导致的变化,(4)为了可靠和高效地传输,虽然用户可以在终端上直接地使用它,但是它的主要作用是供程序使用的。本规范尝试满足大型主机、微型主机、个人工作站、和TACs 的不同需求。例如,容易实现协议的设计。 Java EJB中有、无状态SessionBean的两个例子 两个例子,无状态SessionBean可会话Bean必须实现SessionBean,获取系统属性,初始化JNDI,取得Home对象的引用,创建EJB对象,计算利息等;在有状态SessionBean中,用累加器,以对话状态存储起来,创建EJB对象,并将当前的计数器初始化,调用每一个EJB对象的count()方法,保证Bean正常被激活和钝化,EJB对象是用完毕,从内存中清除…… Java Socket 聊天通信演示代码 2个目标文件,一个服务器,一个客户端。 Java Telnet客户端实例源码 一个目标文件,演示Socket的使用。 Java 组播组中发送和接受数据实例 3个目标文件。 Java读写文本文件的示例代码 1个目标文件。 java俄罗斯方块 一个目标文件。 Java非对称加密源码实例 1个目标文件 摘要:Java源码,算法相关,非对称加密   Java非对称加密源程序代码实例,本例中使用RSA加密技术,定义加密算法可用 DES,DESede,Blowfish等。   设定字符串为“张三,你好,我是李四”   产生张三的密钥对(keyPairZhang)   张三生成公钥(publicKeyZhang)并发送给李四,这里发送的是公钥的数组字节   通过网络或磁盘等方式,把公钥编码传送给李四,李四接收到张三编码后的公钥,将其解码,李四用张三的公钥加密信息,并发送给李四,张三用自己的私钥解密从李四处收到的信息…… Java利用DES私钥对称加密代码实例 同上 java聊天室 2个目标文件,简单。 java模拟掷骰子2个 1个目标文件,输出演示。 java凭游戏 一个目标文件,简单。 java求一个整数的因子 如题。 Java生成密钥的实例 1个目标文件 摘要:Java源码,算法相关,密钥   Java生成密钥、保存密钥的实例源码,通过本源码可以了解到Java如何产生单钥加密的密钥(myKey)、产生双钥的密钥对(keyPair)、如何保存公钥的字节数组、保存私钥到文件privateKey.dat、如何用Java对象序列化保存私钥,通常应对私钥加密后再保存、如何从文件中得到公钥编码的字节数组、如何从字节数组解码公钥。 Java数据压缩与传输实例 1个目标文件 摘要:Java源码,文件操作,数据压缩,文件传输   Java数据压缩与传输实例,可以学习一下实例化套按字、得到文件输入流、压缩输入流、文件输出流、实例化缓冲
©️2020 CSDN 皮肤主题: 数字20 设计师:CSDN官方博客 返回首页