python统计分析——用seaborn绘制回归直线(sns.lmplot)

参考资料:用python动手学统计学,帮助文档

1、导入库

# 导入库
# 用于数值计算的库
import numpy as np
import pandas as pd
import scipy as  sp
from scipy import stats
# 用于绘图的库
import matplotlib.pyplot as plt
import seaborn as sns
sns.set()
# 用于估计统计模型的库
import statsmodels.formula.api as smf
import statsmodels.api as sm

2、数据准备

data=pd.DataFrame({
    'beer':np.array([45.3, 59.3, 40.4, 38. , 37. , 40.9, 60.2, 63.3, 51.1, 44.9, 47. ,
                     53.2, 43.5, 53.2, 37.4, 59.9, 41.5, 75.1, 55.6, 57.2, 46.5, 35.8,
                     51.9, 38.2, 66. , 55.3, 55.3, 43.3, 70.5, 38.8]),
    'temp':np.array([20.5, 25. , 10. , 26.9, 15.8,  4.2, 13.5, 26. , 23.3,  8.5, 26.2,
                     19.1, 24.3, 23.3,  8.4, 23.5, 13.9, 35.5, 27.2, 20.5, 10.2, 20.5,
                     21.6,  7.9, 42.2, 23.9, 36.9,  8.9, 36.4,  6.4]),
    'hue':np.array(['A', 'B' , 'A', 'B' , 'A', 'B' ,'A', 'B' ,'A', 'B' ,'A', 'B' ,
                    'A', 'B' ,'A', 'B' ,'A', 'B' ,'A', 'B' ,'A', 'B' ,
                    'A', 'B' ,'A', 'B' ,'A', 'B' ,'A', 'B' ])
})
data.head()

3、绘制回归直线

sns.lmplot(x='temp',y='beer',data=data)

        上图同时展示了散点图和回归直线,阴影部分是回归直线的置信区间(默认95%的置信度)。下面对函数sns.lmplot()的常用参数进行讲解:

(1)data=None,为数据源,为dataframe格式

(2)x=None,y=None,分别为x轴坐标和y轴坐标,用数据源中的列名代表数据列。

(3)hue=None,代表不同的系列。当设置hue时,

代码如下:

sns.lmplot(x='temp',y='beer',data=data,hue='hue')

效果如下:

(4)col=None,row=None,两个参数类似,col表示分列显示,row表示分行显示。

当对col进行设置的代码和效果如下:

sns.lmplot(x='temp',y='beer',data=data,col='hue')

当对row进行设置的代码和效果如下:

sns.lmplot(x='temp',y='beer',data=data,row='hue')

(5)palette=None,调色板,当对hue进行设置时,用于设置不同系列的默认颜色。

(6)col_wrap=None,当设置了col参数后,用于设置显示的列数,与row参数不兼容。

注意观察下面col_wrap为1和2时的区别:

sns.lmplot(x='temp',y='beer',data=data,col='hue',col_wrap=1)

sns.lmplot(x='temp',y='beer',data=data,col='hue',col_wrap=2)

 

(7)height=5,用于设置最小单位图片的高度,单位inch(英寸)

(8)aspect=1,与height参数配合使用,用于设置最小单位图片的宽度。宽度=aspect * height

(9)markers='o',用于设置散点图的标记样式。默认为“圆点”样式。

(10)sharex=None, sharey=None,用于设置多个图片组合显示时是否共享x坐标轴,或y坐标轴

(11)hue_order=None, col_order=None, row_order=None,用于设置显示顺序。这里以hue_order为例进行说明(注意与hue参数处的展示图片对比观察)

sns.lmplot(x='temp',y='beer',data=data,hue='hue',hue_order=['B','A'])

(12)legend=True,当设置hue参数后,用于设置是否显示图例。当为False时的效果如下:

sns.lmplot(x='temp',y='beer',data=data,hue='hue',legend=False)

(13)x_estimator=None,x_bins=None, x_ci='ci',当x轴数据为离散型数据时使用。

(14)scatter=True,用于设置是否显示散点。当为False时效果如下:

sns.lmplot(x='temp',y='beer',data=data,scatter=False)

(15)fit_reg=True,用于拟合回归曲线。当为False时,则不显示回归曲线。效果如下:

sns.lmplot(x='temp',y='beer',data=data,fit_reg=False)

(16)ci=95,设置置信度,以显示回归曲线的置信区间。

(17)logistic=False,当设置为True时,表示逻辑回归。

  • 9
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值