平方损失函数为什么可以作为目标函数？

最新推荐文章于 2023-02-19 00:08:05 发布

xiaoyi9581

最新推荐文章于 2023-02-19 00:08:05 发布

阅读量3.8k

点赞数 6

分类专栏：机器学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_38374423/article/details/79058983

版权

最近在看斯坦福cs229的讲义，其中第一课有提到线性模型中平方损失函数的由来，觉得挺好的，记录一下。

在机器学习中，平方损失函数

J (θ) = 1 2 (y - y ¯) 2

$J(\theta)=\frac{1}{2}(y-\bar{y})^2$
是比较常用的一个损失函数，我们训练线性回归模型时通常通过最小化这个函数来学习模型，可是其中的原理是什么呢？我们凭直觉可以感受到平方损失函数越小，说明

y¯ $\bar{y}$ 和

y $y$ 越接近，模型越好。下面通过概率论的知识从数学上来证明平方损失函数的作用。

假设有一个样本对集合 $(x^{(i)},y^{(i)}), i = 0,1,...,m$ ，上角标表示第 $i$ 个样本对，总共有 $m$ 个样本，我们想要训练一个线性回归模型 $\bar{y}^{(i)}=\theta^Tx^{(i)}$ 来拟合数据。那么其真实输出值可以表示为

y (i) = θ T x (i) + ϵ (i),

$y^{(i)} = \theta^Tx^{(i)} + \epsilon^{(i)},$
其中参数

θ $\theta$ 是要学习的参数，

ϵ $\epsilon$ 是模型输出与真实值的误差。
误差

ϵ $\epsilon$ 产生的原因可能是模型欠拟合没有抓住数据的全部特征，也可能是随机噪声。我们进一步假设

ϵ(i) $\epsilon^{(i)}$ 的分布是按照均值为0，方差为

σ2 $\sigma^2$ 的高斯模型独立同分布的，用公式表示为

ϵ(i)∼N(0,σ2) $\epsilon^{(i)} \thicksim \mathcal{N}(0,\sigma^2)$ 。那么

ϵ(i) $\epsilon^{(i)}$ 的密度是

最低0.47元/天解锁文章

关注

6
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
平方损失函数为什么可以作为目标函数？

最近在看斯坦福cs229的讲义，其中第一课有提到线性模型中平方损失函数的由来，觉得挺好的，记录一下。在机器学习中，平方损失函数 J(θ)=12(y−y¯)2 J(\theta)=\frac{1}{2}(y-\bar{y})^2 是比较常用的一个损失函数，我们训练线性回归模型时通常通过最小化这个函数来学习模型，可是其中的原理是什么呢？我们凭直觉可以感受到平方损失函数越小，说明 y¯\ba
复制链接

扫一扫

专栏目录

xiaoyi9581 CSDN认证博客专家 CSDN认证企业博客

码龄7年

1: 原创

98万+: 周排名

142万+: 总排名

3826: 访问

: 等级

57: 积分

0: 粉丝

6: 获赞

0: 评论

7: 收藏

私信

关注

热门文章

平方损失函数为什么可以作为目标函数？ 3826

分类专栏

机器学习 1篇

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。