Seaborn常见绘图总结

以前粗略的学习过Matplotlib绘图、Pandas绘图(这里是pandas的常见绘图总结),但是都未深入的去学习过,一遇到问题就翻文档,效率低下。听“他们”说matplotlib中的seaborn绘图很好看而且实用,所以,这里系统的总结一下seaborn常见的图形绘制。其目的也是很简单,方便自己和给大家提供一些帮助(由于英文很菜,每次都查单词,有些词汇就翻译的很生硬,还请谅解……)。

差点忘了,这里使用的数据还是seaborn的默认数据,很多人再看seaborn的时候对数据一头雾水,这里我将存放数据的GitHub放在这儿,理解数据的含义,对分析问题往往起着事半功倍的效果。

https://github.com/mwaskom/seaborn-data

根据Seaborn的API,具体如下:

正文

1.Relational plots(关系图)

Seaborn中介绍的第一种类型的图就是Relational plots(关系图),这里翻译一下官网对他的解释:“统计分析是理解数据集中变量如何相互关联以及这些关系如何依赖于其他变量的过程。可视化可能是这个过程的核心部分,因为当数据被正确地可视化时,人类视觉系统可以看到指示某种关系的趋势和模式。”
Relational plots(关系图)中主要讨论的是三个seaborn函数。我们最常用的是relplot()。这是一个图形级函数使用两种常用方法可视化统计关系:散点图(scatter plots)和线图(line plots)。

 1. scatterplot() (与kind="scatter";默认值)
 2. lineplot() (与kind="line")

还是第一步,导入我们需要的各种模块:

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
sns.set(style="darkgrid") #这是seaborn默认的风格
1.1 scatterplot(散点图)

散点图是统计可视化的重要组成部分。它使用点云来描述两个变量的联合分布,其中每个点代表数据集中的一个观察。这种描绘可以推断出大量关于它们之间是否有任何有意义的关系的信息。
在seaborn中有几种(后面介绍)绘制散点图的方法,当两个变量都是数字时,应该使用的最基本的是scatterplot()功能。在Categorical plots(分类图)中,我们将看到使用散点图可视化分类数据的专门工具。

#scatterplot参数
seaborn.scatterplot(x=None, y=None, hue=None, style=None, size=None, 
data=None, palette=None, hue_order=None, hue_norm=None, sizes=None, 
size_order=None, size_norm=None, markers=True, style_order=None,
 x_bins=None, y_bins=None, units=None, estimator=None, ci=95, n_boot=1000, 
 alpha='auto', x_jitter=None, y_jitter=None, legend='brief', ax=None, **kwargs)

在所有的seaborn绘图时,里面的参数是众多的,但是不用担心,大部分参数是相同的,只有少部分存在差异,有些通过对单词的理解就可知道其含义,这里我只根据每个具体的图形重要的参数做一些解释,并简单的介绍这些常用参数的含义。

  • x,y:容易理解就是你需要传入的数据,一般为dataframe中的列;
  • hue:也是具体的某一可以用做分类的列,作用是分类;
  • data:是你的数据集,可要可不要,一般都是dataframe;
  • style:绘图的风格(后面单独介绍);
  • size:绘图的大小(后面介绍);
  • palette:调色板(后面单独介绍);
  • markers:绘图的形状(后面介绍);
  • ci:允许的误差范围(空值误差的百分比,0-100之间),可为‘sd’,则采用标准差(默认95);
  • n_boot(int):计算置信区间要使用的迭代次数;
  • alpha:透明度;
  • x_jitter,y_jitter:设置点的抖动程度。

先来个简单的散点图,绘制看看效果

#数据来源可在seaborn的GitHub上查找
tips = sns.load_dataset("tips")
ax = sns.scatterplot(x="total_bill", y="tip", data=tips)

在这里插入图片描述
接下来,复杂一点,按另一个变量分组(hue参数起了作用),不同类型的方式(style),点的大小(size),并显示具有不同颜色的组:

ax = sns.scatterplot(x="total_bill", y="tip",hue="day",
 style="time",size='size',data=tips)

在这里插入图片描述
是不是复杂的多,当然还有很多参数可以改,这里就不一一介绍了,接下来看lineplot。

1.2 lineplot(线图)
seaborn.lineplot(x=None, y=None, hue=None, size=None, style=None,
 data=None, palette=None, hue_order=None, hue_norm=None, sizes=None,
  size_order=None, size_norm=None, dashes=True, markers=None, 
  style_order=None, units=None, estimator='mean', ci=95, n_boot=1000, 
  sort=True, err_style='band', err_kws=None, legend='brief', ax=None, **kwargs)

可以看出,参数并没有较散点图有较大的改变,所以话不多说,直接上图:

还是下来个简单的:

fmri = sns.load_dataset("fmri")
ax = sns.lineplot(x="timepoint", y="signal", data=fmri)

#阴影是默认的置信区间,可设置ci=0,将其去除

阴影是默认的置信区间,可设置ci=0,将其去除
接下来,来个复杂一点儿的:

#使用标记而不是破折号来识别组
ax = sns.lineplot(x="timepoint", y="signal",hue="event", style="event",
markers=True, dashes=False, data=fmri)

在这里插入图片描述

1.3 relplot(关系图)
seaborn.relplot(x=None, y=None, hue=None, size=None, style=None, 
data=None, row=None, col=None, col_wrap=None, row_order=None, 
col_order=None, palette=None, hue_order=None, hue_norm=None, 
sizes=None, size_order=None, size_norm=None, markers=None, dashes=None,
 style_order=None, legend='brief', kind='scatter', height=5, aspect=1,
  facet_kws=None, **kwargs)

relplot(关系图)可以看做是lineplot和scatterplot的归约,可以通过kind参数来指定画什么图形,重要参数解释如下:

  • kind:默认scatter(散点图),也可以选择kind=‘line’(线图);
  • sizes:List、dict或tuple,可选,简单点就是图片大小,注意和size区分;
  • col、row:将决定网格的面数的分类变量,具体看实例;
tips = sns.load_dataset("tips")
g = sns.relplot(x="total_bill", y="tip", data=tips)
#两者效果一模一样
ax = sns.scatterplot(x="total_bill", y="tip", data=tips)

在这里插入图片描述
其他参数设置:

g = sns.relplot(x="total_bill", y="tip", hue="time", size="size",
palette=["b", "r"], sizes=(10, 100),col="time",row='sex', data=tips)

在这里插入图片描述
关于kind=‘line’,这里就不画了,重点是理解参数的意义。

2.Categorical plots(分类图)

Categorical plots(分类图)可以具体分为下面三种类型,8个小图:

  1. Categorical scatterplots(分类散点图)
    stripplot(分布散点图)
    swarmplot(分布密度散点图)
  2. Categorical distribution plots(分类分布图)
    boxplot(箱线图)
    violinplot(小提琴图)
    boxenplot(字母价值图???)
  3. Categorical estimate plots(分类估计图)
    pointplot(点图)
    barplot(条形图)
    countplot(计数统计图)

2.1 Categorical scatterplots(分类散点图)

2.1.1 stripplot(分布散点图)

stripplot(分布散点图)的意思就是按照不同类别对样本数据进行分布散点图绘制。stripplot(分布散点图)一般并不单独绘制,它常常与boxplot和violinplot联合起来绘制,作为这两种图的补充。

seaborn.strippl
  • 393
    点赞
  • 2779
    收藏
    觉得还不错? 一键收藏
  • 40
    评论
评论 40
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值