机器学习（二）代价函数和梯度下降

最新推荐文章于 2023-04-11 14:30:52 发布

已经变秃何时变强

最新推荐文章于 2023-04-11 14:30:52 发布

阅读量527

点赞数 1

分类专栏： #机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_51719414/article/details/116849329

版权

#机器学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

系列文章目录

机器学习（一）机器学习简介

文章目录

系列文章目录
前言
一、机器学习模型表示
二、代价函数（Cost Function）
三、梯度下降（Gradient Descent）
总结

前言

本文主要记录机器学习中代价函数和梯度下降的重点。

注：本文是基于吴恩达老师的机器学习课程所做的学习重点笔记摘录。

一、机器学习模型表示

机器学习模型的实现是使用训练集训练映射函数 h(x) 来预测输出值

以简单的只有一个变量X的线性回归为例子，该模型函数 h 可如下图表示：
在这里插入图片描述

二、代价函数（Cost Function）

通过训练集训练得出映射函数 h(x) 之后，需要使用一个指标来衡量映射函数的预测能力，指的就是代价函数（cost function）。

同样以一个变量的简单线性回归为例子，该模型的代价函数为：
在这里插入图片描述
注意代价函数J是关于所有参数θ的函数，这于映射函数h不同。

代价函数J的是基于“使通过映射函数h预测的值于实际值的差距最小”的目标构建的。

下图是关于θ0和θ1的代价函数J(θ0,θ1)：
在这里插入图片描述

三、梯度下降（Gradient Descent）

有了代价函数后，找到最准确合适的映射函数这一目标（即合适的参数θ），就可以转换为找到最小的代价函数J的值。
在这里插入图片描述
为了找出代价函数J的最小值，提出了梯度下降的概念。

如果把代价函数的图型看作一座山，当我们最开始站在某一点（即随机初始化一点），选择比能到达低海拔点的路劲作为下山路径。

每走一步，就看一下，选择比当前点海拔低的点作为下一个点。

循环往复，直到到达最低点。
在这里插入图片描述

1、局部最优解

当初始化的点不同时，那么找到的最低点可能不同。
在这里插入图片描述
这样就出现了一个特殊的现象，即梯度下降找到的点很大可能是局部最低点。

当陷入局部最低点时，无法通过梯度下降原则达到别的地点。

所以，梯度下降的一个特点是找出的解是局部最优解，当到达局部最优时，会停止对参数的迭代。

2、参数同步更新

梯度下降的令一个特点是多个参数θ同步更新。

在使用梯度下降寻找代价函数最低点时，点的变化更新代表着参数θ0和θ1时同时变化的，即多个参数θ同步更新
在这里插入图片描述

3、学习速率α

在这里插入图片描述
梯度下降更新参数时通过参数α来控制参数θ迭代更新的幅度。

如果参数α太小，那么需要迭代很多次才有可能得到最优解；

如果参数α太大，那么可能永远也得不到最优解。
在这里插入图片描述
当越来越接近最优解的时候，代价函数J的在该点的切线斜率（即对J求导）越来越小。

这时，我们不需要更改α的值，就能使θ的迭代幅度越来越小。
在这里插入图片描述

4、将梯度下降应用于简单线性回归模型

下图为梯度下降和一元向量的线性回归模型：
在这里插入图片描述
带入后能得到更新参数θ的公式：

当代价函数J的值处于最低点时，映射函数h的你和效果最好。

5、批量梯度下降

批量梯度下降（Batch Gradient Descent） 指梯度下降的每一步都是建立在所有的训练样本上的，在有些机器学习模型中，梯度下降不会使用所有训练样本，而是使用其中的一部分。
在这里插入图片描述

总结

代价函数J是关于所有参数θ的函数，这于映射函数h不同。

梯度下降是找打代价函数最低值的一个方法，该方法的特点有：
1. 局部最优解
2. 参数同步更新，参数α控制着参数θ更新的幅度

以及批量梯度下降的概念。

注：参考资料来自于吴恩达老师的课程，点击直达

已经变秃何时变强

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

已经变秃何时变强 CSDN认证博客专家 CSDN认证企业博客

码龄4年

6: 原创

112万+: 周排名

55万+: 总排名

1万+: 访问

: 等级

69: 积分

5: 粉丝

6: 获赞

3: 评论

32: 收藏

私信

关注

热门文章

分类专栏

最新评论

免疫组库vdj的数据处理（TCR/BCR）
小木亘: 您好，感谢您的分享。我最近也在使用TraCeR进行单细胞TCR分析。有两个问题想请教您。1）筛选CDR3序列/TCR的时候，第二个过滤条件我没有文章中看到类似的说法，想请问您是否方便提供这个条件的出处？同时关于TPM卡阈值的问题我似乎只在张泽民老师他们的文章里面看到这个条件。2）我看TraCeR定义克隆是根据V gene加上junction sequence再加上J genes这样去定义的，同时它最后assembly的时候也会输出CDR3的nt/aa信息，我另外还有一批10X数据，想和TraCeR的结果match上，但10X的ouput数据是没有junction sequences这一部分的，想请问在这种情况下，对于10X TCR 数据克隆的定义您有什么建议吗？
机器学习阴性集的选择 —— drug-target interactions （DTIs）
已经变秃何时变强: 你说的其实还是这里举出的第一种方法，也是最开始用的方法。第一种方法里就是把你手上有的药物和靶点集合中验证过存在确实关系的作为阳性集，没有证实存在关系的就作为阴性集，但是这样阴性集就会存在假阴性。所以后面的几种方法就是为了弥补这个缺陷
机器学习阴性集的选择 —— drug-target interactions （DTIs）
Kivsen: 各位大佬，小弟初探生信，一直存在一个问题。如果已知的DTI可以作为正例集那么，如何产生反例集的数据？毕竟我没办法获取到不存在关联的药物靶点对或者说，我无法断言，一对尚未存在关联的药物靶点就一定不存在关系。
机器学习阴性集的选择 —— drug-target interactions （DTIs）
不正经的kimol君: 收获很多，谢谢大佬的分享

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。