线性回归分析

最新推荐文章于 2023-10-25 23:08:57 发布

GeekStuff

最新推荐文章于 2023-10-25 23:08:57 发布

阅读量7.8k

点赞数 7

分类专栏： MLDM 文章标签：线性回归 R

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/aspirinvagrant/article/details/39671829

版权

本文详细介绍了简单线性回归模型，通过R语言分析cats数据集，展示了如何建立回归方程、预测和检验显著性。通过散点图、残差分析和影响度量，探讨了模型的拟合情况和变量间的关系。最后讨论了模型的泛化能力和数据转换的重要性。

摘要由CSDN通过智能技术生成

简单线性回归模型描述了两个变量x和y之间的关系，用以下方程表示。θ₀ 和θ₁为参数，ξ为误差。

y=θ₀ +θ₁x + ξ

线性回归模型的目标是通过减少响应变量的真实值与预测值的差值来获得模型参数，即使得残差平方和最小。

下面给出线性回归的例子。在数据集MASS cats中，它包含了两个随机变量Bwt和Hwt的样本数据，主要描述成年雄猫和雌猫的体重和心脏的重量。

Sex：性别，由F和M标识；

Bwt：体重，单位kg；

Hwt：心脏重量，单位g；

做出Bwt和Hwt之间的散点图：

从上面的散点图中可以得到，可以使用简单线性回归，找出它的系数。回归使用普通最小二乘法（Ordinary least squares）和拟合线性模型：y_i = θ₀+ θ₁x_i + ε_i，ε_i为误差项。线性回归模型可以表示为：

Hwt=θ₀ +θ₁* Bwt + ξ

计算回归的方程

为了计算回归方程，在简单线性回归模型中，我们选择参数θ₀ 和θ₁ ，并最小化ξ的平方和。那么只要根据x找到合适的y即可：

y_predict=θ₀ +θ₁* x

根据cats数据集上的简单线性回归模型，估计下一个cat的Hwt，它的体重为3.3kg时？

我们采用lm函数根据Bwt变量计算Hwt，然后提取回归方程的参数，见下图

在这种情况下，回归方程是

y=-0.35 + 4.03* x

现在可以根据回归方程就可以估计出Bwt=3.3kg时，cat的Hwt是多少了。

根据简单线性回归模型，cat的Hwt=3.3kg时，它的Hwt为13.84g。

显著性检验

在线性回归模型中，假设ξ和x是相互独立的，并且属于均值为0方差为常数的正态分布，那么通过检验无效假设θ₁= 0来确定x和y是否存在显著关系。接下来我们确定在显著水平为0.05的线性回归模型中Bwt和Hwt之间的显著关系？

由于p-value的值远小于0.05，拒绝无效假设θ₁= 0，因此基于cats数据集的线性回归模型变量之间的关系显著。

最低0.47元/天解锁文章

关注

7
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。