机器学习 -- 线性回归的简单版理解

最新推荐文章于 2022-03-03 11:09:57 发布

viviuolo

最新推荐文章于 2022-03-03 11:09:57 发布

阅读量202

点赞数

分类专栏：机器学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/viviuolo/article/details/105659456

版权

机器学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

回归

对于一组特征数据和其标记值(x1, y1), (x2, y2), ……, (xi, yi)。
假设x表示房间个数， y表示价格。用特征值个数来对价格进行预测，此时价格是连续的，可以是2w，也可以是2.11w。
假设x表示价格，y表示房间个数。用价格来预测可以带几个房间的房子，此时房间个数是离散的，你只能买1个，2个，但是你无法买1.2个房间。
通常y是连续的，则称为回归；如果y是离散的，则称为分类。

线性回归

假如x轴表示房间个数，y表示价格。你需要找出一条尽量包含很多样本点的直线，你可以画出很多条，像图中的1或者2.
y = kx + b；（k和b就是参数）
在这里插入图片描述

那么如何来判定，哪条直线更好呢（k和b最优）？

损失函数

度量单样本预测的错误程度，损失函数值越小，模型就越好。错误程度就是样本点距离预测直线的距离，简单来说就是哪条曲线预测的房价更能贴近真实的房价。
问题到这里，就演化成寻找最小的损失函数值，哪种损失函数值越小哪种模型（哪种直线）就越好。

寻找最小的损失函数值

1、梯度下降法
可以简单的看为图上的一元二次曲线，寻找最低的那点o，怎么才能找到o呢？先从图上取一点a，然后沿着负梯度的方向迭代（简单说就是沿着斜率绝对值下降的方向移动），例如a -> b ->c，最后无限趋向于o。
在这里插入图片描述
其中a向b移动中的横向距离称为步长。步长如果过大，可能直接跨过o点，无法收敛。

2、最小二乘法
3、牛顿法
4、拟牛顿法

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。