Python数据可视化学习笔记:第一章 关联图 第二节 使用Python绘制多类别散点图

前言

声明:这个系列的博文都是我自己学习所得的东西,秉承着每天进步一点点的理念进行学习,我参考的课程是《菊安酱与菜菜的Python机器学习可视化50图》,使用的Python版本为3.6.4。
今天学习的内容是多类别散点图的绘制,之前我有用到过这样的图,主要是为了表达多阈值对地物的分离程度。我把这次的学习分为两种,第一种是无图例的,第二种是有图例的。
在这里插入图片描述

无图例的多类别散点图制作

区分的目的是多类别数据的散点图的图例生成较为复杂,,先从简单的入手。

#Author:Albert(CSDN:一个跻身科研大浪的小白)
#Time:2020/03/23
#usage:散点图

import numpy as np #数学处理库
import pandas as pd #用于处理.csv excel html 文本等文件
import matplotlib as mpl #画图像的库
import matplotlib.pyplot as plt #画二维图像的库
import seaborn as sns #颜色库

#2.无图例,分类型变量,即存在有两种数据,两列X对应一列y的情况
x = np.random.randn(10,2)#10行2列的数据集
y = np.array([0,0,1,1,0,1,0,1,0,0])#类别:假设目前有两种类型的数据分别是0和1

plt.figure(figsize=(8,4))

plt.scatter(x[:,0],x[:,1],s=50,c=y)

plt.show()

看看效果:
在这里插入图片描述
此时基本出现了多类别散点图的效果,现在需要加入图例,使图片完整,如果按照简单的散点图的图例生成方法进行,会怎么样呢?大家可以尝试。

有图例的多类别散点图

思路:我们可以遍历每一个点的类别和颜色,然后生成不同类别的图例。
接下来,我来给出代码:

#Author:Albert(CSDN:一个跻身科研大浪的小白)
#Time:2020/03/23
#usage:散点图

import numpy as np #数学处理库
import pandas as pd #用于处理.csv excel html 文本等文件
import matplotlib as mpl #画图像的库
import matplotlib.pyplot as plt #画二维图像的库
import seaborn as sns #颜色库

#3.有图例,分类型变量,即存在有两种数据,两列X对应一列y的情况
x = np.random.randn(10,2)#10行2列的数据集
y = np.array([0,0,1,1,0,1,0,1,0,0])#类别:假设目前有两种类型的数据分别是0和1

plt.figure(figsize=(8,4))

#要想生成两个图例,就要循环,分别循环颜色和标签

colors = ["red","black"]
labels=["Zero","One"]

for i in range(x.shape[1]):
	plt.scatter(x[y==i,0],x[y==i,1],c=colors[i],label=labels[i])

#在标签中存在几种类别,我们就循环几次,一次画一个点
plt.legend()
plt.show()

来看看效果,已经达到了我们的效果:
在这里插入图片描述

完整代码

我会把每一期的代码都以注释的形式展示,这样慢慢增大知识库。

#Author:Albert(CSDN:一个跻身科研大浪的小白)
#Time:2020/03/23
#usage:散点图

import numpy as np #数学处理库
import pandas as pd #用于处理.csv excel html 文本等文件
import matplotlib as mpl #画图像的库
import matplotlib.pyplot as plt #画二维图像的库
import seaborn as sns #颜色库

#画散点图的函数plt.scatter()

'''#1.绘制一个简单的散点图:X1和X2之间的关系图

#定义数据
x1 = np.random.randn(10)#取10个随机数,其中random为随机数函数,randn为取的数是正态分布的数
x2 = x1+x1**2-10

#确定一个画布,当只有一个图可以不确定
plt.figure(figsize=(8,4))#第一条线是横的,第二条是竖的

#绘图
plt.scatter(x1,x2,s=20,c="blue",label="Positive")#(横纵坐标,点的尺寸大小,颜色,图例的名称可以不写)

#装饰图形
plt.legend()#显示图例

plt.show()#显示图形'''


'''#2.无图例,分类型变量,即存在有两种数据,两列X对应一列y的情况
x = np.random.randn(10,2)#10行2列的数据集
y = np.array([0,0,1,1,0,1,0,1,0,0])#类别:假设目前有两种类型的数据分别是0和1

plt.figure(figsize=(8,4))

plt.scatter(x[:,0],x[:,1],s=50,c=y)

plt.show()'''


#3.有图例,分类型变量,即存在有两种数据,两列X对应一列y的情况
x = np.random.randn(10,2)#10行2列的数据集
y = np.array([0,0,1,1,0,1,0,1,0,0])#类别:假设目前有两种类型的数据分别是0和1

plt.figure(figsize=(8,4))

#要想生成两个图例,就要循环,分别循环颜色和标签

colors = ["red","black"]
labels=["Zero","One"]

for i in range(x.shape[1]):
	plt.scatter(x[y==i,0],x[y==i,1],c=colors[i],label=labels[i])

#在标签中存在几种类别,我们就循环几次,一次画一个点
plt.legend()
plt.show()

练习:增强实用性

我们在进行实际操作时,不可能使用的是简单的随机数,而是我们的成果。下面就以一个实例增强代码的实用性,例如:有一个EXCLE表格中含有三个类型的变量,我们怎么生成这样的多类别散点图呢?
(下面的数据是我在做项目的真实数据所以不共享了,我对重要的部分做了隐藏,大家可以以自己的数据做实验)
效果先展示一下,答案明天给出:
在这里插入图片描述

思考

这样的代码对于类别较少的数据还可以自己纯手动敲,但是对于几十种类型呢?

  • 3
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值