【傻瓜攻略】深度学习之海森矩阵(九)

本来这一章应该接着上一章进行优化算法的介绍的。但是,后来我发现接下去的很多算法都是与海森矩阵紧密相关的,所以在这一章先介绍海森矩阵,牛顿算法这些,然后再接着介绍剩余的优化算法。话不多说,下面开始:

1、海森矩阵 Hessian Matrix

海森矩阵是一个自变量为向量的实值函数的二阶偏导数组成的方块矩阵,函数为:

海森矩阵和牛顿法密切相关。

可以利用海森矩阵进行多元函数的极值判断。参考:https://blog.csdn.net/guoyunfei20/article/details/78246699


2、牛顿法

是一种在实数域和复数域上近似求解方程的方法。

参考:https://baike.baidu.com/item/%E7%89%9B%E9%A1%BF%E6%B3%95/1384129#4 以下是牛顿法的本源原理:


总结来说:牛顿法就是一种近似于泰勒级数展开的一种迭代接近求值的方法。当然,上述的分析是在一元平面的,在深度学习的过程中我们更需要的是在二维平面上的求解。

参考:https://www.cnblogs.com/shixiangwan/p/7532830.html


蓝色的为目标函数,红色的为切线。整个过程就是求解最小值的方法。是不是和梯度下降有点相似?但是这个方法的下降速度比梯度下降要快的多。

关于上述图像的求解方法:

参考网址:https://www.cnblogs.com/monoSLAM/p/5246665.html


讨论到多维即x是一个向量的时候的牛顿迭代公式为:

参考:https://www.cnblogs.com/ljy2013/p/5129294.html

算法步骤:


牛顿法的缺点在于最优化求解的时候需要求解海森矩阵。

3、拟牛顿法

由于海森矩阵的逆矩阵计算过于复杂,所以诞生了拟牛顿算法,即用一个正定矩阵代替海森矩阵的逆矩阵,从而减缓运算复杂度。


多维的时候,二阶求导式子可写作海森矩阵,这样:


我们可以选择用一个正定矩阵代替海森矩阵,


每次迭代我们需要更新代替矩阵Gk。

3.1 DFP算法

参考:https://www.cnblogs.com/ljy2013/p/5129294.html

其核心是:通过迭代的方法,对做近似。其中


反正,经历了一系列的推到,得出矫正公式

其中:



唔,感兴趣的童鞋可以根据3.1的连接去看原文,我这里就直接粘贴推导结果了。再次感谢大大们的细心撰写,耐心推导!!!!

3.2 BFGS算法

其中矫正公式为:  

具体算法:


3.3 L-BFGS :省内存的BFGS

下面是另外一种算法的表示方式:

我只能做到这里了,╮(╯▽╰)╭看不懂,大大们的世界太复杂。反正了解一下,就是一个省内存的算法。


这里为止,我应该介绍完了所有的有关海森矩阵和牛顿法的东西了。反正……就是辣么个东东,后面大概是要接触到的。了解一下,(#^.^#),我也是一知半解啊,╮(╯▽╰)╭。

等以后再回来看可能会好一些。先这样放在这里,当做一篇笔记的flag,等以后了解了一点再回来改。

  • 16
    点赞
  • 110
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
要跑通深度学习模型,你可以按照如下步骤进行操作: 1. 首先,搭建深度学习环境。你可以参考引用中提到的B站视频教程,其中讲解了如何从零开始搭建深度学习环境,并以Pix2PixGAN为例进行了实践演示。该视频提供了傻瓜式的手把手教程,对于初学者来说非常友好。 2. 确保你已经获取了深度学习模型的代码和数据。引用中提到的基于深度学习的故障诊断模型代码和数据可以作为一个参考。这个模型提供了数据和源码,并且已经经过验证,可以直接跑通。通过查看源码中的全面注释,你可以更好地理解代码的功能和实现细节。 3. 理解模型的输入和输出。在运行深度学习模型之前,你需要明确输入数据的格式和预期的输出结果。这取决于你要解决的任务和具体的模型架构。可以参考模型代码中的注释和说明来了解这些信息。 4. 运行模型。通过设置好环境变量、安装必要的依赖库和模型所需的特定软件包,你可以开始运行深度学习模型了。根据你所使用的深度学习框架(如TensorFlow、PyTorch等),可以按照相应的文档和教程进行操作。 5. 调优和优化。一旦你成功地运行了深度学习模型,你可能会发现一些性能方面的问题。你可以尝试调整模型的超参数、优化算法或使用其他技术来提高模型的准确性和效率。 总结来说,要跑通深度学习模型,你需要搭建深度学习环境、获取代码和数据,理解模型的输入和输出,运行模型,并进行调优和优化。以上步骤是一个一般的指导,具体的操作取决于你的具体需求和所使用的深度学习框架。希望对你有所帮助!

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值