运筹系列40：L-BFGS的pytorch版本

最新推荐文章于 2023-07-11 16:08:00 发布

IE06

最新推荐文章于 2023-07-11 16:08:00 发布

阅读量2.5k

点赞数 1

分类专栏：运筹学

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/kittyzc/article/details/106543299

版权

运筹学专栏收录该内容

93 篇文章 358 订阅

订阅专栏

1. 原理简介

L是limited memory的意思。BFGS是四个数学家的名字。连续优化问题基本原理是泰勒二阶展开后，求导=0，用迭代的方法进行求解。
迭代公式很简单： $f'_{x_k}+f''_{x_k}(x_{k+1}-x_k)=0$
$f^{'}$ 是一个向量， $f^{''}$ 是一个矩阵，称为Hessian阵。Hessian计算比较复杂，我们用迭代的方式计算，迭代方程改写为：
$x_{k+1}=x_k-f'f''^{-1}$ 。我们用D来近似 $f''^{-1}$ ，迭代公式为：
在这里插入图片描述

注意如下几点：
（1）这里有2个迭代：第一个迭代计算 $D$ ，第二个迭代计算 $f$ 。为了节省时间，我们每一轮迭代都干脆让两个迭代一起进行。
（2）在深度学习时，数据量往往非常大。假设我们数据有10w维，那么每次迭代算出来的D有74.5G，内存、显存都放不下。所以我们用时间换空间，使用L-BFGS方法，将D的计算过程存储下来，需要的时候计算一下即可。
（3）为了进一步节省内存，我们只保留一定步数的计算过程。

2. 代码

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
运筹系列40：L-BFGS的pytorch版本

1. 原理L是limited memory的意思。BFGS是四个数学家的名字。连续优化问题基本原理是泰勒二阶展开后，求导=0，用迭代的方法进行求解。数学表达式很简单：fxk′+fxk′′(xk+1−xk)=0f'_{x_k}+f''_{x_k}(x_{k+1}-x_k)=0fxk′+fxk′′(xk+1−xk)=0f′f'f′是一个向量，f′′f''f′′是一个矩阵，称为Hessian阵。迭代方程改写为：xk+1=xk−x_{k+1}=x_k-xk+1=xk−2. numpy库
复制链接

扫一扫

专栏目录

IE06 CSDN认证博客专家 CSDN认证企业博客

码龄9年

276: 原创

2万+: 周排名

4374: 总排名

83万+: 访问

: 等级

7501: 积分

1355: 粉丝

841: 获赞

309: 评论

4004: 收藏

私信

关注

热门文章

分类专栏

最新评论

深度学习系列4：onnx
CSDN-Ada助手: opencv 库原来就是视觉库，现在也算人工智能库，你觉的核心原因是什么？
python系列30：各种爬虫技术总结
小王毕业啦: 博主的这篇文章《python系列30：各种爬虫技术总结-CSDN博客》真是写得太棒了！通过博主的详细介绍，我对于爬虫技术有了更深入的了解，收获颇丰。博主的写作功底非常扎实，细节描写令人印象深刻，让我感受到了博主的丰富经验和知识储备。希望博主能够继续分享更多优质文章，也期待能够得到博主的指导与帮助，一同进步成长。再次感谢博主的辛勤付出与支持，期待更多精彩内容！
运筹系列65：使用Julia精确求解tsp问题
风雪中的石子: 大哥，请问你这图是用啥画的
运筹系列1：线性规划单纯形法python代码
野猪365: 这样检验数跟着矩阵一起pivot会在变量较多的情况下导致检验数不准确吗
运筹系列27：Cplex中的callback function
Realm_add1: 数学模型第6行代码似乎少乘了客户的需求量

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。