Python可视化-----复杂的散点图
文章目录
前言
提示:00 安装库,配置环境
在Python中进行可视化,我们需要的是这些库:
matplotlib:python中自带的,也是最常用的可视化工具包,在Jupyter中甚至可以找到matplotlib的网站。
seaborn:python中可视化的新起之秀,致力于统计数据可视化。
brewer2mpl:brewer2mpl是一个专供python使用的,用于访问colorbrewer2色谱的工具,colorbrewer2是一个专业颜色顾问公司。
matplotlib
通常来说,如果我们是使用anaconda安装的python,那matplotlib是自带的
如果你发现你的python环境中没有matplotlib,那你可以使用以下命令先安装pip,然后从pip中安装matplotlib:
下面展示安装代码
。
python -m pip install -U pip
python -m pip install -U matplotlib
你可以通过在Jupyter中运行 print(matplotlib.version) 来查看你现有的matplotlib版本。
下面展示运行代码
。
import matplotlib as mlp
print(mlp.__version__)
seaborn是需要自己安装的。如果不是anaconda自带,建议使用pip安装。
#%%cmd
#pip install seaborn
import seaborn as sns
print(sns.__version__)
seaborn要求必须0.9.0以上,否则代码会报错,不足0.9.0的大家可以使用以下代码进行升级。
下面展示相关代码
。
#%%cmd
#pip install --upgrade seaborn
brewer2mpl
同样也需要自己安装,使用以下代码:
#%%cmd
#pip install brewer2mpl
不必过于在意版本,通常来说都是直接安装成最新版。
提示:以下是本篇文章正文内容,下面案例可供参考
一、我们的目标是什么?
我们的目标是:绘制出下图,并且利用数据解读图内的信息。
二、实现目标的知识准备
1.引入库
代码如下(示例):
import numpy as np
import pandas as pd
import matplotlib as mpl
import matplotlib.pyplot as plt
import seaborn as sns
%matplotlib inline
#如果你在使用Jupyter Notebook,你会需要这样一句命令来让你的图像显示
2.导入数据
代码如下(示例):
#导入数据
midwest = pd.read_csv("https://raw.githubusercontent.com/selva86/datasets/master/midwest_filter.csv")
midwest.head()
该处使用的url网络请求的数据。
3.准备标签的列表和颜色
代码如下(示例):
#(1)标签
midwest['category']
#提取标签中的类别
categories = np.unique(midwest['category']) #去掉所有重复的项
categories #这就是我们要使用的标签的类别列表
颜色
接下来要创造和标签的类别一样多的颜色,如果只有三四个类别,或许我们还可以自己写,然而面对十几个,或者二十个分类,我们需要让matplotlib来帮助我们自动生成颜色。
plt.cm.tab10()
用于创建颜色的十号光谱,在matplotlib中,有众多光谱供我们选择:https://matplotlib.org/tutorials/colors/colormaps.html
我们可以在plt.cm.tab10()中输入任意浮点数,来提取出一种颜色。光谱tab10中总共只有十种颜色,如果输入的浮点数比较接近,会返回类似的颜色。这种颜色会以元祖的形式返回,表示为四个浮点数组成的RGBA色彩空间或者三个浮点数组成的RGB色彩空间中的随机色彩。
代码如下(示例):
#(2)颜色
color1