【机器学习】线性回归模型

最新推荐文章于 2024-03-07 16:14:52 发布

菜小白—NLP

最新推荐文章于 2024-03-07 16:14:52 发布

阅读量615

点赞数

分类专栏： ML

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ACM_hades/article/details/90441137

版权

本文介绍了线性回归模型，包括模型概述、最小二乘法和梯度下降算法。通过矩阵运算解析了最小二乘法的求解过程，以及在XXT可逆和不可逆情况下的解决方案。同时，阐述了梯度下降法的基本思想及其在求解线性回归模型中的应用。

摘要由CSDN通过智能技术生成

一、线性回归模型概述

线性回归模型：简单的来说就是在样本空间中的一条直线或者一个平面或者更高维的超平面，并且我们要使得预测值与真实值之间的误差最小化。
三维样本空间如下图：
二维样本空间：

二、线性回归模型

给定训练集 $D={(x_1,y_1 ),(x_2,y_2 ),…,(x_n,y_n)}$ 其中 $x_i∈R^d;y∈R;$ 线性回归模型如下： $f(x_i )=w^T x_i+b$ 并且我们期望得到的模型有下面式子成立： $f(x_i )≈y_i$
为便于讨论我们将将 $b$ 并入到 $w$ 中： $x_i=[x_i^1,x_i^2,…,x_i^d,1]^T$ $w_i=[w_i^1,w_i^2,…,w_i^d,b]^T$ 所以线性回归模型可以表示为： $f(x_i )=w^T x_i$
我们将每个样本的预测值与真实值记为： $ε_i$ $y_i=w^T x_i+ε_i$
假设误差 $ε_i$ 是独立同分布的，并且服从高斯分布。即： $P(ε_i )=\frac{1}{\sqrt{2πσ}} exp(-\frac{ε_i^2}{2σ^2 })$ $ε_i=y_i-x_i$ 带入得到： $P(y_i |x_i,w)=\frac{1}{\sqrt{2πσ}} exp(-\frac{(y_i-w^T x_i)^2}{2σ^2 })$ 已知参数 $w$ 和数据 $x_i$ 的情况下，预测值为 $y_i$ 的条件概率.
注：这个地方个人感觉比较疑惑： $P(ε_i )$ 按理来说表示的是误差为

最低0.47元/天解锁文章

菜小白—NLP

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

菜小白—NLP CSDN认证博客专家 CSDN认证企业博客

码龄7年

135: 原创

5万+: 周排名

146万+: 总排名

26万+: 访问

: 等级

3891: 积分

79: 粉丝

261: 获赞

44: 评论

823: 收藏

私信

关注

热门文章

分类专栏

RL
NLP 40篇
ACM 22篇
Python 17篇
Tensorflow 18篇
ML 17篇
Pytorch 2篇

最新评论

【机器学习】密度聚类算法之HDBSCAN
小吕布鑫爱貂蝉: 和官方网站的不太一样，聚类簇那儿是减lamba(birth)而不是lamba(death)，不然最后的簇无法计算稳定性
【机器学习】密度聚类算法之HDBSCAN
小吕布鑫爱貂蝉: 同样的，卡在这一步上了
优先队列
Linzy️: data[]似乎也可以不用，用cin>>Heap[i]存入就行，降低空间复杂度
优先队列
Wind_Qiu: pop函数有两个地方有错，第30行，int result = Heap[1];你的堆是从下标1开始的，不是从下标0开始的。第31行，int x = Heap[Heap_size--]; 先是记录最后一个元素，size再减减，先减减的话记录的是倒数第二个元素，这样会造成倒数第一个元素丢失的。
支持向量机(SVM)——python代码实现
qq_63937295: 你好，你解决这个问题了吗，我也想知道怎么改

最新文章

目录

目录

分类专栏

RL
NLP 40篇
ACM 22篇
Python 17篇
Tensorflow 18篇
ML 17篇
Pytorch 2篇

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。