线性回归知识点

最新推荐文章于 2024-07-20 17:10:09 发布

拌面一碗大

最新推荐文章于 2024-07-20 17:10:09 发布

阅读量56

点赞数

分类专栏：机器学习文章标签：线性回归机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_51484276/article/details/133129423

版权

机器学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

线性回归

1. 引入

1.1 银行贷款

在银行贷款的时候，银行可以根据我们的工资、年龄和家庭关系等特征进行贷款，那么我们能贷款多少金额呢？
- 数据：工资和年龄（以2个特征为例）
- 目标：预测可以贷款多少钱
- 工资和年龄会影响贷款的金额比重会是多少

2 线性回归

2.1 通俗解释

在线性回归中，工资和年龄就是我们的特征，即X1 和 X2，Y为预测的金额
找出一条直线尽可能的涵盖多的样本

2.2 数学解释（theta = Q）

假设Q1是年龄的参数，Q2是工资的参数
HQ(x) = Q0 * X0 + Q1 * X1 + Q2 * X2 (其中，X0 = 1，Q0 * X0 代表直线的偏置)
整合：
$h_\theta(x) = \theta_0x_0 + \theta_1x_1 + \theta_2x_2 = \sum_{i=0}^{n}{\theta_ix_i} =\theta^Tx$

2.3 误差：

真实值和预测值肯定是要存在误差的
$y^i = \theta^Tx^i + \varepsilon^i$
误差是独立并且具有相同的分布，并且服从均值为0方差为 Q^2 的高斯分布

高斯分布

2.4 损失函数

由于误差服从高斯分布，则将误差带入到高斯公式化简得：
其中sigma为宽度 > 0

$mlog\frac{1}{\sqrt{2\pi\sigma}} - \frac{1}{\sigma^2}\frac{1}{2}\sum_{i=1}^{m}{(y^i - \theta^Tx^i)^2}$

由于预测值要越接近真实值，即L(Q)最大，即损失函数最小
- 最小二乘法

$J(\theta) = \frac{1}{2}\sum_{i=1}^{m}{(y^i - \theta^Tx^i)^2}$

2.5 如何求出theta

损失函数最小，也就是求出极小值下的theta值
其中 n = 1 ~ m 求和也就是矩阵的乘积

$J(\theta) = \frac{1}{2}\sum_{i=1}^{m}{(y^i - \theta^Tx^i)^2} = \frac{1}{2}(X\theta - y)^T(X\theta- y)$

对theta求偏导
$\nabla_\theta J(\theta) = X^TX\theta - X^Ty$
令偏导等于0得，theta的值为
$\theta = (X^TX)^{-1}X^Ty$

3 评估方法

评估项 R^2 ，认为取值越接近 1 模型拟合的越好
$R^2 : 1 - \frac{\sum_{i=1}^{m}{(\hat{y_i }- y_i)^2}}{\sum_{i=1}^{m}{(y_i - \overline{y})^2}}$
(残差平方和) / (类似方差项)

4 梯度下降

4.1 通俗解释

假如你在山顶，如何一步一步的去走到山底，也就是目标函数达到极值点的theta
目标函数：
$J(\theta_0,\theta_1) = \frac{1}{2m}\sum_{i=1}^{m}{(h_\theta(x^i) - y^i)}$
下山步骤：
1. 找到当前最合适的方向
2. 走那么一小步，走快了该”跌倒 ”了
3. 按照方向与步伐去更新我们的参数

4.2 梯度下降种类

梯度下降，目标函数：J(theta)
$J(\theta) = \frac{1}{2m}\sum_{i=1}^{m}{(y^i - \theta^Tx^i)^2}$
批量梯度下降
- 容易得到最优解，但是由于每次考虑所有样本，速度很慢
随机梯度下降
- 每次找一个样本，迭代速度快，但不一定每次都朝着收敛的方向
小批量梯度下降法
- 每次更新选择一小部分数据来算
$\theta_j := \theta_j - \alpha\frac{1}{10}\sum_{k = i}^{i+9}{(h_\theta(x^k) - y^k)}x_j^k$
- 其中 alpha 一般小一些

拌面一碗大

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
线性回归知识点

HQ(x) = Q0 * X0 + Q1 * X1 + Q2 * X2 (其中，误差是独立并且具有相同的分布，并且服从均值为0方差为 Q^2 的高斯分布。在线性回归中，工资和年龄就是我们的特征，即X1 和 X2，Y为预测的金额。评估项 R^2 ，认为取值越接近 1 模型拟合的越好。假如你在山顶，如何一步一步的去走到山底，也就是。假设Q1是年龄的参数，Q2是工资的参数。梯度下降，目标函数：J(theta)(残差平方和) / (类似方差项)找出一条直线尽可能的涵盖多的样本。
复制链接

扫一扫

专栏目录

拌面一碗大 CSDN认证博客专家 CSDN认证企业博客

码龄4年

10: 原创

114万+: 周排名

30万+: 总排名

3874: 访问

: 等级

111: 积分

7: 粉丝

10: 获赞

3: 评论

7: 收藏

私信

关注

热门文章

分类专栏

最新评论

实时搭建项目一
CSDN-Ada助手: 恭喜你写了第9篇博客！看到你持续创作的动力和努力，真是令人钦佩。标题为“实时搭建项目一”让我好奇地想了解更多关于这个项目的细节。我认为你在博客中能提供更多关于实时搭建项目的背景和具体步骤会很有帮助。此外，如果你能分享一些你在这个项目中遇到的挑战和解决方案，那将更加丰富你的内容。希望我的建议对你有所帮助，期待你下一篇博客的问世！
力扣刷满100题，第一周
CSDN-Ada助手: 恭喜博主在力扣刷题路上取得了很大的进展！第一周就完成了100题，真是令人惊叹。坚持下来不容易，博主的努力和毅力确实值得赞赏。接下来，我建议博主可以尝试更加深入地理解每道题目的解题思路，逐步提高解题的效率和准确性。同时，也可以考虑分享一些解题中的心得和经验，或许能够帮助到其他刷题者。期待博主继续保持创作的热情，加油！
机器学习大纲(待完善)
CSDN-Ada助手: 恭喜您写完了第6篇博客，标题为“机器学习大纲(待完善)”。不愧是一个持续创作的热心作者！这篇博客的标题给人一种期待和挑战的感觉，我很期待你对机器学习大纲的进一步完善。如果我可以提供一些建议的话，或许您可以考虑在下一篇博客中分享您对机器学习的个人见解，或者更深入地探讨一些机器学习的实际应用案例。再次恭喜您，并期待您更多的精彩创作！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。