regplot()、lmplot() 和 residplot() 之间的区别?

一个基于 matplotlib 的 Python 数据可视化包称为 Seaborn。它提供了一个复杂的绘图工具,用于创建引人注目和教育性的统计视觉效果。Seaborn协助解决了Matplotlib的两个主要问题,哪个是?

我们现在相信,教学生如何使用ggplot2的方法生成这些表示 - 需要更多的编码,但更先进,适应性强和透明 - 将使学生受益。在这里,由 residPlot() 制作的基本绘图使用 ggplot2 作为资源重建,以帮助用户从 residPlot() 切换到 ggplot2。

特征

regplot()

lmplot()

residplot()

目的

在两个变量之间绘制一个简单的线性回归模型

绘制线性回归模型,同时将一个变量按另一个变量分组

绘制线性回归模型的残差

可视化

具有回归线和置信区间的散点图

具有回归线和置信区间的散点图,能够按一个变量对另一个变量进行分组

参考线为零的残差散点图

效用

用于快速可视化两个变量和线性回归模型之间的关系,拟合

可用于可视化两个变量之间的关系和线性回归模型拟合,同时考虑第三个变量的影响

可用于可视化线性回归模型的残差以及检查残差中的模式或结构

回归模型

简单线性回归模型

线性回归模型

线性回归模型

输出

具有回归线和置信区间的散点图

具有回归线和置信区间的散点图,按第三个变量分组

参考线为零的残差散点图

seaborn.regplot()

数据和线性回归模型的拟合使用 seaborn.regplot() 函数绘制。有几个选项可用于估计回归模型,所有这些选项都是相互不兼容的。

语法

 

seaborn.regplot( x, y, data=None, x_estimator=None, x_bins=None, x_ci=’ci’, scatter=True, fit_reg=True, ci=95, n_boot=1000, units=None, order=1, logistic=False, lowess=False, robust=False, logx=False, x_partial=None, y_partial=None, truncate=False, dropna=True, x_jitter=None, y_jitter=None, label=None, color=None, marker=’o’, scatter_kws=None, line_kws=None, ax=None)

参数 − 以下是几个关键参数的描述 −

  • x, y − 这些是输入变量。如果是字符串,则这些应与“data”部分中的列名匹配。轴将在使用熊猫对象时指示系列名称。

  • data − 这是一个数据帧,其中每行表示一个观测值,每列表示一个变量。

  • lowess − 此参数接受布尔值,并且是可选的。如果为“True”,则使用“statsmodels”(局部加权线性回归)估计非参数 Lowess 模型。

  • color − 应用于所有叙事部分的颜色。

  • 要使用的散点图标记的标记 −(可选)(可选)标志符号。

返回 − 包含绘图的轴对象。

海伯恩。Implot()

seaborn.lmplot() 是 Seaborn 函数库中的一个函数,用于可视化两个数值变量之间的关系。它创建一个散点图,并将线性回归模型拟合到数据。它是可视化变量与回归模型之间关系的便捷方法,也可用于比较不同组或类别的变量之间的关系。

下面是如何在 Python 中使用 lmplot() 函数的示例 −

 

import seaborn as sns # Load the data df = sns.load_dataset('titanic') # Create an lmplot with fare and age as the x and y variables, and class as the hue sns.lmplot(x='fare', y='age', hue='class', data=df) # Show the plot plt.show()

这将创建一个散点图,其中包含拟合数据的线性回归模型,并将按类列为点着色。

lmplot() 函数有几个参数,可用于自定义绘图的外观和行为。一些主要参数是 -

  • x − 要用作 x 变量的列的名称。

  • y − 要用作 y 变量的列的名称。

  • 色调 − 用于为点着色的列的名称。

  • 数据 − 用于绘图的数据帧。

  • col − 用于为每个唯一值创建子图的列的名称。

  • row − 用于为每个唯一值创建子图的列的名称。

  • fit_reg − 一个布尔值,指示是否将线性回归模型拟合到数据。

  • scatter_kws − 要传递给 scatter() 函数的关键字参数字典。

  • line_kws − 传递给 plot() 函数的关键字参数字典。

返回 − 此方法返回带有绘图的 FacetGrid 对象,以便进一步调整

seaborn.residplot()

语法

 

seaborn.residplot(x, y, data=None, lowess=False, x_partial=None, y_partial=None, order=1, robust=False, dropna=True, label=None, color=None, scatter_kws=None, line_kws=None, ax=None)

参数 − 下面给出了一些主要参数的描述 −

  • x − “data”部分中预测变量的数据或列名。

  • y − “data”部分中响应变量的数据或列名。

  • data − 具有列“x”和“y”的数据帧。

  • lowess −(可选)使用更平滑的lowess拟合残差散点图。

  • dropna − 此参数是可选的,接受布尔值。如果为 True,则在拟合和绘制图表时,忽略缺少数据的观测值。

结论

总之,regplot()、lmplot() 和 residplot() 是 Python 库 Seaborn 中的函数,用于创建回归图。这些图用于可视化两个变量之间的关系以及该关系的强度。

Regplot() 是一个函数,用于绘制数据的散点图并将线性回归模型拟合到数据。它允许您指定 x 和 y 变量、数据以及各种自定义选项,例如点的颜色、大小和样式。

Lmplot() 是一个将 regplot() 与分面图相结合的函数,允许您在单个图中绘制多元回归图。它允许您指定 x 和 y 变量、数据以及色相、列和行变量以创建分面图。它还允许您指定各种自定义选项,例如点的颜色、大小和样式。

Residplot() 是一个绘制线性回归模型残差的函数。它允许您指定 x 和 y 变量、数据以及各种自定义选项,例如点的颜色、大小和样式。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值