线性回归和代价函数

最新推荐文章于 2024-02-29 11:26:11 发布

码小花

最新推荐文章于 2024-02-29 11:26:11 发布

阅读量1.9k

点赞数 4

分类专栏：机器学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sarracode/article/details/94844961

版权

机器学习专栏收录该内容

14 篇文章 0 订阅

订阅专栏

目录

1.线性回归算法：监督学习算法的例子

2.代价函数数学定义，有助于弄清楚如何把最有可能的直线与我们的数据相拟合

3.前面给出了代价函数的数学定义，接下来给出例子直观理解代价函数的作用

4.然后我们要讨论有两个参数的情况

1.线性回归算法：监督学习算法的例子

这里还是住房价格的例子，假设你有一个朋友有一个1250平方的房子，想要卖掉，那么根据这个模型，可以用一条直线来拟合，告诉他可以卖到220K，这是监督学习的例子，因为每一个例子有一个“正确答案”。

现在有一个房价的训练集，我们的工作是从这个数据集中学习如何预测房价，下面要定义一些符号：

假设小写字母m表示训练样本的数量，x代表输入变量或特征，y表示输出变量，用（x，y）表示一个训练样本

用他来表示第i个训练样本，上标i只是一个训练集的索引，指的是这个表格中第i行。

学习算法会得出一个假设函数h，而h就是一个引导从x得到y的函数。

函数h的作用是预测y是关于x的线性函数

线性函数是学习复杂函数的基础，先拟合线性函数再处理更加复杂的模型

这个模型称为线性回归，这个例子是一个一元线性回归，变量是x，另一个名字是单变量线性回归

2.代价函数数学定义，有助于弄清楚如何把最有可能的直线与我们的数据相拟合

在线性回归中有一个这样的训练集， $\Theta$ i是模型参数，如何选择这两个参数，选择的参数不同的得到的假设函数就不同，如下所示

假设在线性回归中有一个这样的训练集，我们需要做的就是得出 $\Theta$ 0 $\Theta$ 1这两个参数的值来让假设函数表示的直线尽量地与这些数据点很好的拟合

如何得出这两个参数的值呢？

我们的想法是我们要选择能使h(x）输入x时我们预测的值最接近该样本对应的y值的参数 $\Theta$ 0 $\Theta$ 1

所以，我们要得到一定数量的样本，知道x卖出哪所房子和卖出房子的实际价格。

那么，在线性回归中，我们要解决的是一个最小化问题

也就是关于 $\Theta$ 0 $\Theta$ 1的最小化而且希望这个式子极小h(x)-y也就是想要h(x)和y之间的差异要小

因此尽量减少假设的输出与房子的真实价格之间的差的平方

而现在对所有的训练样本进行一个求和，

将第i号对应的预测结果减去第i号房子的真实价格所得的差的平方相加得到总和，并且尽量减小这个值

因此我们把这个问题变成找到能使我的训练集中预测值和真实值的差的平方的和的1/2M最小的 $\Theta$ 0 $\Theta$ 1的值

那么这个就是线性回归的整体目标函数，把这个函数改写，要定义一个代价函数，J( $\Theta$ 0 , $\Theta$ 1) ，求其最小值

代价函数也叫做平方误差函数，也称为平方误差代价函数

3.前面给出了代价函数的数学定义，接下来给出例子直观理解代价函数的作用

为了更好地理解，我们对代价函数做了简化：

那么假设现在有三个训练的样本，分别是（1,1），（2,2），（3,3），并假设 $\Theta$ 1=1，那么得出的代价函数的值：J（1）=0

假设 $\Theta$ 1 = 0.5，那么在这种情况下J（0.5） = 0.58

当 $\Theta$ 1 = 0时，J（0） = 2.3

当 $\Theta$ 1 = -0.5时，误差会非常大，J（-0.5） = 5.25

经过一系列计算，你可以得到J（ $\Theta$ 1）函数的图像

对于每一个 $\Theta$ 1，都对应着一个J（ $\Theta$ 1）的值，也对应着不同的假设函数

学习算法的优化目标是通过选择 $\Theta$ 1的值获得最小的J（ $\Theta$ 1）的值，这是线性回归的目标函数，

在这里当 $\Theta$ 1 = 1时，J（ $\Theta$ 1）的值最小，h(x)是一条符合数据的直线，完美的拟合了这些数据

4.然后我们要讨论有两个参数的情况

下面是我们的假设函数，两个参数，代价函数，优化目标：

这次要保留两个参数，假设 $\Theta$ 0 = 50， $\Theta$ 1 = 0.06

使用等高线图来展示这些曲面图像，在右侧的等高线图中，位于同一个椭圆圈中的J值是相同的，那么中心就是J值最小

当取右侧图中的红色的参数时，即 $\Theta$ 1 = -0.15， $\Theta$ 0 = 800时，假设函数的图像在左边

那么会发现这条线没有很好的拟合数据，它离最小值相当远，这是相当大的代价，因为拟合的并不好

接下来，再看一个例子，当取另一个参数时，即 $\Theta$ 0 =360， $\Theta$ 1 = 0时，同样拟合的不是很好，

最后一个例子，这个拟合的不错，不是最小值，但是相当接近了，即如下：

关注

4
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

码小花 CSDN认证博客专家 CSDN认证企业博客

码龄5年

55: 原创

7万+: 周排名

146万+: 总排名

8万+: 访问

: 等级

1081: 积分

20: 粉丝

75: 获赞

17: 评论

395: 收藏

私信

关注

热门文章

分类专栏

最新评论

bert中文使用总结
m0_75217567: 博主能分享一下预训练模型吗？科大讯飞能够已经下载不了了
决策树例子与python实现
m0_64860572: 有c4.5决策树代码的例子吗
文本蕴涵模型测试过程
uuunicornM: “在运行train.py文件时遇到错误：InvalidArgumentError (see above for traceback): indices[0，10] = 47392 is not in [0, 45100) 是因为换了数据，因此词典和npy文件都要重新生成” 你好，我也出现了这个问题，请问是怎么解决的？
bert中文使用总结
Ang_Quantum: 感谢博主的文章！顺便想问一个问题，我把Google的BERT转为torch版本后，发现模型生成的向量和tensorflow版本的有略微的不一样(2%的相似度误差)。楼主知道是什么原因吗？有没有让torch生成的向量和tensorflow完全一样的方法呢？
octave的基本操作
LHNC: 为什么函数就是未定义，我用遍了网上找到的方法T-T

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。