目录
Relational plots(关系图)
关系图用来表示两个连续型变量的关系。当然,不是连续型变量,也可以画,就是图形表现不好。
预备数据
示例数据集 :https://github.com/mwaskom/seaborn-data
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
sns.set(style='white') # 指定画板底色
tips = pd.read_csv(r'../input/seaborn-data/tips.csv')
tips.head()
1、scatterplot
seaborn.scatterplot(x=None, y=None, hue=None, style=None, size=None,
data=None, palette=None, hue_order=None, hue_norm=None, sizes=None,
size_order=None, size_norm=None, markers=True, style_order=None,
x_bins=None, y_bins=None, units=None, estimator=None, ci=95, n_boot=1000,
alpha='auto', x_jitter=None, y_jitter=None, legend='brief', ax=None, **kwargs)
- data:指定数据集,一般是 dataframe 数据格式
- x,y:传入的数据,分别指定 data的两列
- hue: 指定类别,以不同的颜色绘制。(非必需,但可以配合参数 palette 使用)
- style:指定类别,以不同的样式绘制 。(非必需,但可以配合参数 makers 使用)
- size: 指定类别,以不同的标记大小绘制。 (非必需,但可以配合参数 sizes 使用)
- palette:调色板,可选值有:
- markers:绘图的形状,可选值有:
- sizes:会图点(或特殊样式标记)的大小,可选值有
- alpha:透明度
- x_jitter,y_jitter:设置点的抖动程度。
- ci:允许的误差范围(空值误差的百分比,0-100之间),可为‘sd’,则采用标准差(默认95);
- n_boot(int):计算置信区间要使用的迭代次数;
sns.scatterplot(data=tips, x="total_bill", y="tip")
1.1 指定标记点颜色 (参数hue 和 参数palette 的使用)
1)hue 指定离散的非数字值,比如 “time”,取值为 Dinner、Lunch
sns.scatterplot(data=tips, x="total_bill", y="tip", hue="time")
2)如果hue指定的变量是数字,且语义映射是定量的,图例会按枚举值列出来
sns.scatterplot(data=tips, x="total_bill", y="tip", hue="size")
3)如果hue指定参数为大量唯一的数值,图例将显示一个具有代表性的等间距集合
tip_rate = tips.eval("tip / total_bill").rename("tip_rate")
sns.scatterplot(data=tips, x="total_bill", y="tip", hue=tip_rate)
4)hue 配合参数palette来指定颜色
简单说下palette可选择的值: deep、muted、bright、pastel、drak、colorbind
sns.scatterplot(data=tips, x="total_bill", y="tip", hue="size", palette="deep")
1.2 指定标记点样式 (参数style 和 参数markers 的使用)
sns.scatterplot(data=tips, x="total_bill", y="tip", hue="time", style="time")
# hue 和 style 分别指定两个不同的变量
sns.scatterplot(data=tips, x="total_bill", y="tip", hue="day", style="time")
# 配合参数 makers 使用, 指定标记样式
markers = {"Lunch": "s", "Dinner": "X"}
sns.scatterplot(data=tips, x="total_bill", y="tip", style="time", markers=markers)
1.3 指定标记点大小 (参数size 和 参数sizes 的使用)
sns.scatterplot(x="total_bill", y="tip", size="size", data=tips);
sns.scatterplot(data=tips, x="total_bill", y="tip", hue="size", size="size")
1.3 其他参数的使用
控制标记区域的大小范围,设置legend ="full"强制每个唯一的值出现在图例中
sns.scatterplot(data=tips, x="total_bill", y="tip", hue="size",
size="size", sizes=(20, 200), legend="full")
如果需要分子图绘制,则需要使用函数 sns.relplot(), 指定kind=“scatter” , 参数 col 用来指定需要分图绘制的维度
sns.relplot(data=tips, x="total_bill", y="tip", col="time", hue="day", style="day",kind="scatter")
2、lineplot
seaborn.lineplot(x=None, y=None, hue=None, size=None, style=None,
data=None, palette=None, hue_order=None, hue_norm=None, sizes=None,
size_order=None, size_norm=None, dashes=True, markers=None,
style_order=None, units=None, estimator='mean', ci=95, n_boot=1000,
sort=True, err_style='band', err_kws=None, legend='brief', ax=None, **kwargs)
sns.lineplot(x='total_bill', y='tip', data=tips)
3、relplot
可以看做是lineplot和scatterplot的归约,可以通过kind参数来指定画什么图形
seaborn.relplot(x=None, y=None, hue=None, size=None, style=None,
data=None, row=None, col=None, col_wrap=None, row_order=None,
col_order=None, palette=None, hue_order=None, hue_norm=None,
sizes=None, size_order=None, size_norm=None, markers=None, dashes=None,
style_order=None, legend='brief', kind='scatter', height=5, aspect=1,
facet_kws=None, **kwargs)
- kind:默认scatter(散点图),也可以选择kind=‘line’(线图);
- sizes:List、dict或tuple,可选,简单点就是图片大小,注意和size区分;
- col、row:将决定网格的面数的分类变量,具体看实例;
sns.relplot(x='total_bill', y='tip', data=tips)
sns.relplot(data=tips, x="total_bill", y="tip", col="time", hue="day", style="day",kind="scatter")