python数据可视化seaborn(三)——探索变量之间的关系
我们常常想知道变量之间是否存在关联,以及这些关联是否收到其他变量影响。可视化能够帮助我们非常直观的展示这些。
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
%matplotlib inline
import warnings
warnings.filterwarnings('ignore')
# 不发出警告
sns.set_context('notebook',font_scale=1.2)
tips = sns.load_dataset("tips")
tips.head()
total_bill | tip | sex | smoker | day | time | size | |
---|---|---|---|---|---|---|---|
0 | 16.99 | 1.01 | Female | No | Sun | Dinner | 2 |
1 | 10.34 | 1.66 | Male | No | Sun | Dinner | 3 |
2 | 21.01 | 3.50 | Male | No | Sun | Dinner | 3 |
3 | 23.68 | 3.31 | Male | No | Sun | Dinner | 2 |
4 | 24.59 | 3.61 | Female | No | Sun | Dinner | 4 |
relplot
这是一个seaborn新的图形级函数,通过kind
参数,能对scatterplot()
和lineplot()
两个轴级函数进行访问。
*seaborn.relplot(x=None, y=None, hue=None, size=None, style=None, data=None, row=None, col=None, col_wrap=None, row_order=None, col_order=None, palette=None, hue_order=None, hue_norm=None, sizes=None, size_order=None, size_norm=None, markers=None, dashes=None, style_order=None, legend=‘brief’, kind=‘scatter’, height=5, aspect=1, facet_kws=None, *kwargs)
- [hue,size,style]: 可以生成不同的颜色,大小,样式来独立的显示第三个变量
- [row,col]: 按照某个变量分列或者分行
- col_wrap: int, 分成几列(不能与参数row共同出现)
- sizes: 对size参数的每个分类设定大小
- 大小值列表
- 变量到大小的字典映射
- 包含最大最小的元组,会在此范围对值归一化
- [col,row,size,hue,style]_order: 指定变量出现的顺序。
- hue_norm: 当hue的变量值数字时,用于将colormap标准化,如果是分类变量则无关。
- size_norm: 数据单元的标准化,当size变量为数字时缩放图像
- legend: 如何绘制图例
- False:不绘制图例
- ‘brief’(默认):数值型的hue和size参数会用均匀间隔的样本表示
- ‘full’:对比‘brief’,每个组都会在图例中输出一个条目
- facet_kws: 要传递给FacetGrid其他参数的字典
散点图
sns.relplot(x="total_bill", y="tip", data=tips,
kind='scatter', # ['scatter','line']
hue='day', # 设置按颜色分类的第三变量