最优化理论（三）

_森罗万象

已于 2022-02-02 00:16:39 修改

阅读量1k

点赞数 1

分类专栏：最优化理论文章标签：算法

于 2022-01-31 09:34:00 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_52812620/article/details/122758209

版权

最优化理论专栏收录该内容

3 篇文章 0 订阅

订阅专栏

配合视频中科大-凸优化
配合笔记凸优化笔记

文章目录

三、凸优化算法

三、凸优化算法

$L P$ 松弛和拉格朗日松弛的对偶关系，带等式约束可微凸优化的罚函数
可微凸优化问题对偶函数和罚函数形式：二范数和 $l o g - b a r r i e r$
黄金分割迭代法，回溯直线搜索 $Armijo\quad Rule$ 方法
函数的强凸性定义
强凸函数的凸优化目标估计
精确线性搜索和非精确线性搜索算法的收敛性
最后解释的特征值差距很大的“扁”图导致算法收缩性较差的解释：对称矩阵的主轴定理：特征值描述一个“椭圆”的长轴和短轴大小， $H e s s i a n$ 矩阵的特征值控制了迭代算法的步长，配合视频效果奇佳
迭代方向选择：最速下降法的范数约束，梯度下降和最速下降的变种：坐标轮换法， $f (x)$ 在某些点不可微
牛顿法与拟牛顿法
梯度下降法，最速下降法和牛顿法总结和无约束和有约束问题
关于"已经 $min\quad f_0(x^k+d^k)$ 了，为什么还要再 $min\quad f_0(x^k+\alpha^k d^k)$ ，不能直接 $x^{k+1}=x^{k}+d^k$ 吗，这样不是也已经使得 $f_0(x^{k+1})$ 最小了吗”的回答：系数过大Loss不收敛，系数过小收敛太慢， $d^k$ 一般只会利用方向信息， $\alpha^k$ 实际表示了学习率，控制了步长，另外求最小时使用了近似，找到的 $d^k$ 实际并不能使其 $m i n$ ，再次利用 $\alpha$ 可以在 $d$ 方向上利用线性搜索算法实际使得 $min\quad f$
拉格朗日法解 $K K T$ 条件中的等式约束非线性方程组
在解有等式约束的优化问题时，理论上可以直接解 $K K T$ 条件，但实际操作中 $K K T$ 条件中的稳定性条件可能是一个非线性方程，很难解。因此在解有约束优化问题时，实际是放弃了直接解 $K K T$ 条件（视频中讨论的方法不是在找方法解 $K K T$ 条件，~~这里强调是因为老师的说法貌似很有误导性~~），而也是采用迭代的方式解每一小步，每一小步也是一个有约束问题，此时的问题可以通过泰勒展开成二次，使得 $K K T$ 条件中的稳定性条件的方程是一个线性方程，而线性方程是方便解出的
视频中提到最优值处的 $H e s s i a n$ 矩阵为零的理解：在最优值处的第 $k$ 步用泰勒展开拟合时是一条水平直线，梯度和 $H e s s i a n$ 应该都为零，只有常数项，只有这样才能表达出是一个直线。因此老师说对于凸问题，第 $k$ 步的 $^2f(x^k)$ 在一般情况下是大于零的（凸函数的二阶条件），最优值处是零
拉格朗日法和增广拉格朗日法的性质
增广拉格朗日法例题解析， $f (x) + g (x)$ 的交替方向拉格朗日乘子法，分布式计算

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
最优化理论（三）

【LP松弛】【罚函数：二范数和log-barrier】【黄金分割迭代法，回溯直线搜索Armijo Rule】【强凸函数】【强凸函数的优化目标估计】【线性搜索算法的收敛性】【梯度下降法，最速下降法，坐标轮换法，次梯度方法】【牛顿法，拟牛顿法】【拉格朗日法，增广拉格朗日法】【交替方向拉格朗日乘子法，分布式计算】
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

_森罗万象 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。