线性回归：最小二乘法与极大似然估计

wanlinBee要努力

已于 2024-04-06 15:21:45 修改

阅读量982

点赞数 18

分类专栏：机器学习文章标签：线性回归最小二乘法机器学习

于 2024-04-06 15:13:55 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wanlinBee/article/details/137411270

版权

本文详细解释了线性回归中最小二乘法的原理，以及它与极大似然估计的关系。通过讨论似然估计的概念，说明为何误差平方和被用于损失函数，并介绍了L1和L2正则化在解决非满秩问题时的作用，以及它们如何影响线性回归模型的求解过程。

摘要由CSDN通过智能技术生成

在线性回归中，损失函数是【最小二乘法】，但是为什么使用该损失函数呢？【最小二乘法】与【极大似然估计】又有什么关系呢？

线性回归：最小二乘与极大似然估计

什么是“似然”？

在统计学中，似然与概率是相对的概念。已知样本的数据分布，估计某个采样结果的可能性为概率估计；已知样本分布的结果，估计该分布的具体参数则为似然估计。

极大似然估计

假设：样本是独立同分布的（大多数机器学习模型的前提假设就是样本独立同分布），且样本服从正态分布（随机变量之和的分布近似服从正态分布）。
已知样本数据，求其服从的最有可能的分布，即求该样本分布的极大似然估计：
也即，求分布的具体参数 $\theta$ ；
也即，求使得每个样本同属于某正态分布的概率最大的参数；
又因为样本是独立同分布的，即等于求取每个样本的概率密度的连乘：

$L(\theta)=\prod_{i=1}^{N} p(y^{(i)}|x^{(i)};\theta)$

又因为概率（小于1的数）的连乘会是一个很小的数，上式可能直接会下溢到零，所以我们通过取对数log将概率的连乘转化为概率的求和（使用对数不会影响我们求取目标函数最大值，因为log函数是单调递增的，映射后不会影响变量之间的相对大小）：

$log(L(\theta))=log\prod_{i=1}^{N} p(y^{(i)}|x^{(i)};\theta)=\sum_{i=1}^{N} log(p(y^{(i)}|x^{(i)};\theta))$

求解最大化对数似然函数即可求得分布参数 $\theta$ ：

$\argmax_{\theta}L(\theta)=\argmax_{\theta}\sum_{i=1}^{N} log(p(y^{(i)}|x^{(i)};\theta))$

为什么可以用误差平方和来表示线性回归问题的损失函数？

因为误差可被认为是服从正态分布的随机变量。
对于预测值 $h_{\theta}(x^{(i)})$

最低0.47元/天解锁文章

wanlinBee要努力

关注

18
点赞
踩
12

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

wanlinBee要努力 CSDN认证博客专家 CSDN认证企业博客

码龄7年

29: 原创

15万+: 周排名

10万+: 总排名

2万+: 访问

: 等级

597: 积分

200: 粉丝

299: 获赞

16: 评论

277: 收藏

私信

关注

热门文章

分类专栏

最新评论

【Leetcode】234-判断回文链表
CSDN-Ada助手: 恭喜您发布了第19篇博客！看到您分享关于Leetcode中判断回文链表的解题思路，我感到非常欣慰。建议您在下一篇博客中，可以尝试分享一些其他类型的Leetcode题目解析，让读者能够更全面地了解您的编程技能。期待您更多精彩的创作！加油！
【Leetcode】169-众数
wanlinBee要努力: robot开始push刷题进度了吗
【Leetcode】169-众数
CSDN-Ada助手: 实现一个字典树（Trie）数据结构，支持查找、插入、删除操作。
【Leetcode】169-众数
CSDN-Ada助手: 实现一个字典树（Trie）数据结构，支持查找、插入、删除操作。
【Leetcode】160-相交链表
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)使用更多的站内链接。

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。