【seaborn】基础介绍、函数汇总、总结


Introduction

  • seaborn 默认使用的是 pandas 的 DataFrame 数据格式
  • seaborn 有自己的内置数据集,可以直接调用,函数为sns.load_dataset()
  • 如果使用pycharm,需要最后使用 plt.show() 才能展示图片

下面将分成几个部分介绍 seaborn

序号绘图类型名称说明
1Relational plots(关系图)用来表示两个连续变量的关系
2Categorical plots(分类图)表示两个变量之间的关系,其中一个变量是离散的
3Categorical distribution plots(分类分布图)表示两个变量之间的关系,两个变量都是是离散的
4Distribution plots (分布图)对原变量进行统计计算,展示其统计特征的绘图
5Regression plots(回归图)在散点图的基础上,拟合出一条线

数据预备

示例数据集 :https://github.com/mwaskom/seaborn-data

import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
sns.set(style='white')  # 指定画板底色

tips = pd.read_csv(r'../input/seaborn-data/tips.csv')
tips.head()

在这里插入图片描述


1、Relational plots(关系图)

1.1 scatterplot

seaborn.scatterplot(x=None, y=None, hue=None, style=None, size=None, 
data=None, palette=None, hue_order=None, hue_norm=None, sizes=None, 
size_order=None, size_norm=None, markers=True, style_order=None,
 x_bins=None, y_bins=None, units=None, estimator=None, ci=95, n_boot=1000, 
 alpha='auto', x_jitter=None, y_jitter=None, legend='brief', ax=None, **kwargs)
  • data:指定数据集,一般是 dataframe 数据格式
  • x,y:传入的数据,分别指定 data的两列
  • hue: 指定类别,以不同的颜色绘制。(非必需,但可以配合参数 palette 使用)
  • style:指定类别,以不同的样式绘制 。(非必需,但可以配合参数 makers 使用)
  • size: 指定类别,以不同的标记大小绘制。 (非必需,但可以配合参数 sizes 使用)
  • palette:调色板,可选值有:
  • markers:绘图的形状,可选值有:
  • sizes:会图点(或特殊样式标记)的大小,可选值有
  • alpha:透明度
  • x_jitter,y_jitter:设置点的抖动程度。
  • ci:允许的误差范围(空值误差的百分比,0-100之间),可为‘sd’,则采用标准差(默认95);
  • n_boot(int):计算置信区间要使用的迭代次数;
sns.scatterplot(data=tips, x="total_bill", y="tip")

在这里插入图片描述

1.1.1 指定标记点颜色 (参数hue 和 参数palette 的使用)

1)hue 指定离散的非数字值,比如 “time”,取值为 Dinner、Lunch

sns.scatterplot(data=tips, x="total_bill", y="tip", hue="time")

在这里插入图片描述

2)如果hue指定的变量是数字,且语义映射是定量的,图例会按枚举值列出来

sns.scatterplot(data=tips, x="total_bill", y="tip", hue="size")

在这里插入图片描述
3)如果hue指定参数为大量唯一的数值,图例将显示一个具有代表性的等间距集合

tip_rate = tips.eval("tip / total_bill").rename("tip_rate")
sns.scatterplot(data=tips, x="total_bill", y="tip", hue=tip_rate)

在这里插入图片描述

4)hue 配合参数palette来指定颜色
简单说下palette可选择的值: deep、muted、bright、pastel、drak、colorbind
在这里插入图片描述

sns.scatterplot(data=tips, x="total_bill", y="tip", hue="size", palette="deep")

在这里插入图片描述

1.1.2 指定标记点样式 (参数style 和 参数markers 的使用)

makers 的样式汇总

sns.scatterplot(data=tips, x="total_bill", y="tip", hue="time", style="time")

在这里插入图片描述

# hue 和 style 分别指定两个不同的变量
sns.scatterplot(data=tips, x="total_bill", y="tip", hue="day", style="time")

在这里插入图片描述

# 配合参数 makers 使用, 指定标记样式
markers = {"Lunch": "s", "Dinner": "X"}
sns.scatterplot(data=tips, x="total_bill", y="tip", style="time", markers=markers)

在这里插入图片描述

1.1.3 指定标记点大小 (参数size 和 参数sizes 的使用)

sns.scatterplot(x="total_bill", y="tip", size="size", data=tips);

在这里插入图片描述

sns.scatterplot(data=tips, x="total_bill", y="tip", hue="size", size="size")

在这里插入图片描述

1.1.4 其他参数的使用

控制标记区域的大小范围,设置legend ="full"强制每个唯一的值出现在图例中

sns.scatterplot(data=tips, x="total_bill", y="tip", hue="size", 
                size="size", sizes=(20, 200), legend="full")

在这里插入图片描述

如果需要分子图绘制,则需要使用函数 sns.relplot(), 指定kind=“scatter” , 参数 col 用来指定需要分图绘制的维度

sns.relplot(data=tips, x="total_bill", y="tip", col="time", hue="day", style="day",kind="scatter")

在这里插入图片描述


2、Categorical plots(分类图)

  • stripplot
  • swarmplot
  • boxplot
  • violinplot

3、Categorical distribution plots(分类分布图)

  • barplot

  • piontplot

  • countplot:只可以指定一个变量

  • catplot:可以通过kind参数来指定画什么图形,kind可取值 ‘strip’, ‘swarm’, ‘box’, ‘violin’,‘point’ ,‘count’, ‘bar’


4、Distribution plots (分布图)

  • distplot
  • kdeplot
  • jointplot
  • pairplot

5、Regression plots(回归图)

  • lmplot
  • regplot

6、Matrix plots(矩阵图)

  • heatmap
  • clustermap

7、FacetGrid

8、PairGrid


3、样式设置

  • 0
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
以下是完整的代码: ```python import pandas as pd import seaborn as sns import matplotlib.pyplot as plt # 读取数据 df = pd.read_excel('新生数据.xls') # 计算男女人数 male_counts = df.groupby('省份')['男'].sum() female_counts = df.groupby('省份')['女'].sum() # 绘制堆叠柱形图 sns.set(style='whitegrid') plt.subplot(2, 2, 4) plt.title('各省男女人数堆叠柱形图') sns.barplot(x=male_counts.index, y=male_counts.values, color='blue', label='男') sns.barplot(x=female_counts.index, y=female_counts.values, color='red', label='女', bottom=male_counts.values) plt.xticks(rotation=30, ha='right') plt.legend() plt.show() ``` 运行结果: ![image-20210814162700929](https://i.loli.net/2021/08/14/8xnq3f5Oo2y6gSd.png) 解释一下代码: 1. 使用pandas库读取Excel文件,得到一个DataFrame对象 2. 对DataFrame对象进行分组和汇总,得到各省男女人数 3. 使用seaborn库绘制堆叠柱形图,并使用matplotlib库的plt.subplot()函数将其放入第4个小图中 4. 最后调用plt.show()函数显示图形 注意事项: 1. 要正确绘制堆叠柱形图,需要把两种数据按照x轴的标签值对齐,即要使用同样的x轴标签 2. 在调用sns.barplot()函数时,需要先绘制男性的柱形(色彩为蓝色),再绘制女性的柱形(色彩为红色),并将女性柱形的bottom参数设为男性柱形的高度,这样女性柱形就会被绘制在男性柱形的上方,形成堆叠柱形图效果

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Enzo 想砸电脑

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值