5.1线性回归

最新推荐文章于 2024-09-13 09:12:58 发布

Shield-Z

最新推荐文章于 2024-09-13 09:12:58 发布

阅读量306

点赞数 4

文章标签：回归线性回归数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Ting_28/article/details/136673713

版权

本文介绍了回归问题的基本概念，重点探讨了线性回归模型，特别是如何通过最小二乘法来求解线性回归中的参数，以及均方误差作为误差函数的选择理由。

摘要由CSDN通过智能技术生成

一、回归问题：

指的是，通过统计分析一组随机变量X₁，...，Xn与另外一组随机变量Y₁，...，Yn之间的关系，得到一个可靠的模型，使得对于给定的X={X₁，...，Xn}，可以利用直观模型对Y = {Y₁，...，Yn}进行预测。

（这里X₁，...，Xn被称为自变量，随机变量Y₁，...，Yn被称为因变量。）

1、在回归中我们有一些数据样本，通过对这些样本进行统计分析，获得一个预测模型 f (·)，使得对于测试数据x = {X₁，...，Xn}，可以得到一个较好的预测值：y = f (x)

2、回归问题在形式上与分类问题十分相似，但是在分类问题中预测值 y 是一个离散值，它代表着通过 x 所预测出来的类别；而在回归问题中，y是一个连续变量。

二、线性回归

线性回归模型是指采用线性组合形式的回归模型，在线性回归问题中，因变量和自变量之间是线性关系的。对于第 n 个因变量Xn，我们乘以权重系数Wn，取 y 为因变量的线性组合：

y = f (X) = W₁X₁ + ··· +WnXn + b

其中 b 为常数项。若W = （W₁，···，Wn），则上式可以写成向量形式：

y = f (X) = WᵀX + b

可以看到w和b决定了回归模型 f（·）的行为。由数据样本可知w和b有许多方法，例如最小二乘法、梯度下降法等。

1、最小二乘法求解线性回归中的参数

以下是最小二次方求解线性回归中参数的问题：

希望找到这样的w和b，使得对于训练数据中每一个样本点<x⁽ⁿ⁾，y⁽ⁿ⁾>，预测值 f（x⁽ⁿ⁾）与真实值 y⁽ⁿ⁾ 尽可能接近。

于是定义一种“接近”程度的度量方式，即误差函数。在这里我们采用均方误差（MSE）作为误差函数:

给定x，则 y 的分布服从如下高斯分布：

意味着在自变量x取某个确定值的时候，我们的数据样本点以回归模型预测的因变量y为中心、以σ²为方差呈高斯分布。

基于高斯分布的假设，我们得到条件概率 p（y|x）的对数似然函数：

这就是我们选择均方误差函数作为误差函数的概率解释的原因。

2、目标

最小化误差函数E，具体做法可以令E对于参数w和b的偏导数为0。

由于我们的问题变成了最小化均方误差，因此习惯上将这种通过解析方法直接求解参数的做法称为最小二乘法。

方便矩阵运算，我们将E表示成向量形式。令：

则E可以表示为：

E = （Y - Xwᵀ - b）ᵀ （Y - Xwᵀ - b）

由于b的表示较为烦琐，我们更改w的表示，将b视为常数1的权重，令：

w = （w₁，···，wn，b）

相应的，对X做如下更改：

则E可以表示为：

E = （Y - Xwᵀ ）ᵀ （Y - Xwᵀ )

对误差函数E求参数w的偏导数，我们得到：

令偏导为0.我们得到：

w = （XᵀX）⁻¹ XᵀY

因此对于测试向量x，根据线性回归模型预测的结果为：

y = x（（XᵀX）⁻¹ XᵀY）ᵀ

关注

4
点赞
踩
9

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Shield-Z CSDN认证博客专家 CSDN认证企业博客

码龄1年

22: 原创

117万+: 周排名

11万+: 总排名

2万+: 访问

: 等级

588: 积分

348: 粉丝

360: 获赞

19: 评论

267: 收藏

私信

关注

热门文章

最新评论

7.卷积神经网络与计算机视觉
Mr.Cssust: 这篇文章深入浅出地阐述了主题，让我对这个领域有了更全面的了解。博主的细节描写非常到位，每一个点都解释得很清楚，让我在阅读过程中没有任何困惑。非常感谢博主的分享，期待看到更多精彩的文章。
7.卷积神经网络与计算机视觉
征途黯然.: The article is fantastic, and 7卷积神经网络与计算机视觉 is truly impressive.
7.卷积神经网络与计算机视觉
程序员不想敲代码啊: ✨您的文章给予了我新的启示和思考，拓宽了我对这个领域的认识，真的是一篇让人收益匪浅的好文。
6.5 Batch Normalization
程序小勇: 🌈精彩绝伦！您的文章给予了我新的启示和思考，拓宽了我对这个领域的认识，真的是一篇让人收益匪浅的好文，在这个信息爆炸的时代，有您这样用心创作的作者，真是令人欣慰，期待您的更多作品的出现，让我们共同进步，共同分享知识和智慧！
7.卷积神经网络与计算机视觉
程序小勇: 🌈精彩绝伦！您的文章给予了我新的启示和思考，拓宽了我对这个领域的认识，真的是一篇让人收益匪浅的好文，在这个信息爆炸的时代，有您这样用心创作的作者，真是令人欣慰，期待您的更多作品的出现，让我们共同进步，共同分享知识和智慧！哈哈哈，已经三连，望互关互粉，谢谢！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。