一个基于 matplotlib 的 Python 数据可视化包称为 Seaborn。它提供了一个复杂的绘图工具,用于创建引人注目和教育性的统计视觉效果。Seaborn协助解决了Matplotlib的两个主要问题,哪个是?
我们现在相信,教学生如何使用ggplot2的方法生成这些表示 - 需要更多的编码,但更先进,适应性强和透明 - 将使学生受益。在这里,由 residPlot() 制作的基本绘图使用 ggplot2 作为资源重建,以帮助用户从 residPlot() 切换到 ggplot2。
特征 | regplot() | lmplot() | residplot() |
---|---|---|---|
目的 | 在两个变量之间绘制一个简单的线性回归模型 | 绘制线性回归模型,同时将一个变量按另一个变量分组 | 绘制线性回归模型的残差 |
可视化 | 具有回归线和置信区间的散点图 | 具有回归线和置信区间的散点图,能够按一个变量对另一个变量进行分组 | 参考线为零的残差散点图 |
效用 | 用于快速可视化两个变量和线性回归模型之间的关系,拟合 | 可用于可视化两个变量之间的关系和线性回归模型拟合,同时考虑第三个变量的影响 | 可用于可视化线性回归模型的残差以及检查残差中的模式或结构 |
回归模型 | 简单线性回归模型 | 线性回归模型 | 线性回归模型 |
输出 | 具有回归线和置信区间的散点图 | 具有回归线和置信区间的散点图,按第三个变量分组 | 参考线为零的残差散点图 |
seaborn.regplot()
数据和线性回归模型的拟合使用 seaborn.regplot() 函数绘制。有几个选项可用于估计回归模型,所有这些选项都是相互不兼容的。
语法
seaborn.regplot( x, y, data=None, x_estimator=None, x_bins=None, x_ci=’ci’, scatter=True, fit_reg=True, ci=95, n_boot=1000, units=None, order=1, logistic=False, lowess=False, robust=False, logx=False, x_partial=None, y_partial=None, truncate=False, dropna=True, x_jitter=None, y_jitter=None, label=None, color=None, marker=’o’, scatter_kws=None, line_kws=None, ax=None)
参数 − 以下是几个关键参数的描述 −
-
x, y − 这些是输入变量。如果是字符串,则这些应与“data”部分中的列名匹配。轴将在使用熊猫对象时指示系列名称。
-
data − 这是一个数据帧,其中每行表示一个观测值,每列表示一个变量。
-
lowess − 此参数接受布尔值,并且是可选的。如果为“True”,则使用“statsmodels”(局部加权线性回归)估计非参数 Lowess 模型。
-
color − 应用于所有叙事部分的颜色。
-
要使用的散点图标记的标记 −(可选)(可选)标志符号。
返回 − 包含绘图的轴对象。
海伯恩。Implot()
seaborn.lmplot() 是 Seaborn 函数库中的一个函数,用于可视化两个数值变量之间的关系。它创建一个散点图,并将线性回归模型拟合到数据。它是可视化变量与回归模型之间关系的便捷方法,也可用于比较不同组或类别的变量之间的关系。
下面是如何在 Python 中使用 lmplot() 函数的示例 −
import seaborn as sns # Load the data df = sns.load_dataset('titanic') # Create an lmplot with fare and age as the x and y variables, and class as the hue sns.lmplot(x='fare', y='age', hue='class', data=df) # Show the plot plt.show()
这将创建一个散点图,其中包含拟合数据的线性回归模型,并将按类列为点着色。
lmplot() 函数有几个参数,可用于自定义绘图的外观和行为。一些主要参数是 -
-
x − 要用作 x 变量的列的名称。
-
y − 要用作 y 变量的列的名称。
-
色调 − 用于为点着色的列的名称。
-
数据 − 用于绘图的数据帧。
-
col − 用于为每个唯一值创建子图的列的名称。
-
row − 用于为每个唯一值创建子图的列的名称。
-
fit_reg − 一个布尔值,指示是否将线性回归模型拟合到数据。
-
scatter_kws − 要传递给 scatter() 函数的关键字参数字典。
-
line_kws − 传递给 plot() 函数的关键字参数字典。
返回 − 此方法返回带有绘图的 FacetGrid 对象,以便进一步调整
seaborn.residplot()
语法
seaborn.residplot(x, y, data=None, lowess=False, x_partial=None, y_partial=None, order=1, robust=False, dropna=True, label=None, color=None, scatter_kws=None, line_kws=None, ax=None)
参数 − 下面给出了一些主要参数的描述 −
-
x − “data”部分中预测变量的数据或列名。
-
y − “data”部分中响应变量的数据或列名。
-
data − 具有列“x”和“y”的数据帧。
-
lowess −(可选)使用更平滑的lowess拟合残差散点图。
-
dropna − 此参数是可选的,接受布尔值。如果为 True,则在拟合和绘制图表时,忽略缺少数据的观测值。
结论
总之,regplot()、lmplot() 和 residplot() 是 Python 库 Seaborn 中的函数,用于创建回归图。这些图用于可视化两个变量之间的关系以及该关系的强度。
Regplot() 是一个函数,用于绘制数据的散点图并将线性回归模型拟合到数据。它允许您指定 x 和 y 变量、数据以及各种自定义选项,例如点的颜色、大小和样式。
Lmplot() 是一个将 regplot() 与分面图相结合的函数,允许您在单个图中绘制多元回归图。它允许您指定 x 和 y 变量、数据以及色相、列和行变量以创建分面图。它还允许您指定各种自定义选项,例如点的颜色、大小和样式。
Residplot() 是一个绘制线性回归模型残差的函数。它允许您指定 x 和 y 变量、数据以及各种自定义选项,例如点的颜色、大小和样式。