写在开头:今天分享的是关于线性关系数据绘图的内容,学习链接同样放在后文。
前文回顾:
第一节分享了Seaborn绘图的整体颜色与风格比例调控,可点击链接查看。
python数据可视化之Seaborn(一)
第二节分享了连续、分类、离散数据的绘图颜色的方法,可点击链接查看。
python数据可视化之Seaborn(二)
第三节分享了对于数据分布的绘图方法,可点击链接查看。
python数据可视化之Seaborn(三)
第四节分享了关于数据相关性的一些绘图展示,可点击链接查看。
python数据可视化之Seaborn(四)
第五节分享了关于分类数据的一些绘图展示方法,可点击链接查看。
python数据可视化之Seaborn(五)
Seaborn可视化内容安排
在Seaborn的学习中安排如下,
一、画风设置:会简单介绍一下绘图风格(一)与颜色风格(二)的设置;
二、绘图技巧:这里会介绍数据集(三)、相关数据(四)、分类数据(五)、线性关系(六)可视化的相关内容;
三、结构网络:本节主要介绍数据识别结构网络的绘图(七)。
二、Seaborn绘图技巧
线性回归绘图
在我们拿到数据时往往都会发现数据与数据之间的相关关系类似于线性关系,这种是很普遍的,对于传统的统计往往解决线性的关系数据有较好的效果,特别是在线性回归的时候,绘制线性关系图能够较快的发现数据的拟合以及自身关系,下面我们首先加载今天使用的包与数据,新加载的stasmodels包会在使用的时候进行说明,
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
import statsmodels
tip = sns.load_dataset("tips")
回归模型图形绘制
在seaborn里有两种主要用来绘制回归图像的函数为regplot()以及lmplot(),这两个函数十分的接近,但也有不同regplot可以接受许多类型的数据比如numpy arrays或者pandas series或者dataframe等,而lmplot()则将数据看作需要的参数,x,y必须是所谓的整洁的数据。下面展示一个常规绘图,
sns.lmplot(x="total_bill", y="tip", data=tips, palette="Set2")
当我们的自变量x为离散型变量的话,我们往往直接画图的效果不好,解决的办法可以通过jitter参数添加随机噪声,使得数据不完全在几个类别上进行回归,也可以通过将类别数据的均值点作为样本点,然后估计其置信区间,
sns.lmplot(x="size", y="tip", data=tips, x_jitter=.1)
sns.lmplot(x="size", y="tip", data=tips, x_estimator=np.mean)