交替极小化算法(Alternating Minimization, AM算法)

蒙奇·D·路飞001

已于 2022-03-28 22:30:22 修改

阅读量6.3k

点赞数

文章标签：算法

于 2022-03-28 22:26:18 首次发布

本文链接：https://blog.csdn.net/weixin_45013329/article/details/123796042

版权

AM算法用于无约束优化问题，尤其在处理双稳定点时需关注收敛速度和全局最小点。在凸函数场景下，AM算法有良好的收敛保证，而在非凸函数中，对初始值的选择和函数特性有特定要求。该算法广泛应用于机器学习的优化问题，如矩阵填充、相位恢复和鲁棒回归，并与坐标下降法有密切关系。

摘要由CSDN通过智能技术生成

AM算法：给定一个初值，交替的固定一个变量，优化其他的，主要求解无约束优化．
对于二元函数，AM算法在双稳定点（bistable　point）停止，但有两个问题需要考虑的
１）收敛到双稳定点的速度，即算法收敛阶
２）收敛到的双稳定点是否是全局最小点
AM算法迭代没有参数，不必花时间调整参数，但也意味着用户对算法进程控制更少．AM算法的收敛性完全依赖优化问题的结构性质．
有界目标函数有多个双稳态点，AM最终收敛的稳定点取决于初始点的位置．
当AM算法求解学习隐变量模型，矩阵填充（子问题是边缘凸），相位恢复问题时，特别注意初始值接近最优点．而对于鲁棒回归（robust　regression），　只有一个稳定点，所以对初值没有太多要求．
AM对于凸问题：
（１）凸可微函数，所有双稳定点都是全局最小点．这与求解大规模凸优化问题的坐标极小化算法很类似（coordinate　minimization）但是AM可以求解不可微的目标函数．（CM其实也可以，不过需要目标函数满足其他的性质, P. Tseng 2001, Convergence of a Block Coordinate Descent Method for Nondifferentiable Minimization）(非凸非光滑)
（２）凸，连续可微，边缘强光滑（二次函数做上界），初值＝（０，０），可证明 $\mathcal{O}(\frac{1}{\varepsilon})$ 次迭代可达到误差 $\varepsilon$ . 具体定理描述见Prateek Jain, Purushottam Kar《Non-convex Optimization for Machine Learning》的总结整理(2)的定理4.1.

AM对于非凸问题：
（１）对于边缘凸函数，双稳态点等价于稳定点
（２）鲁棒双稳态性（robust bistability property）
在这里插入图片描述
右边：通过边缘优化，目标函数局部降低，性质表明，如果目标函数局部不怎么下降了，则接近最优值了．定义有个推论：满足鲁棒双稳态性质的函数，所有的双稳态点都能达到最优函数值．这个推理可由定义ÿ

最低0.47元/天解锁文章

蒙奇·D·路飞001

关注

0
点赞
踩
24

收藏

觉得还不错? 一键收藏
3
评论
交替极小化算法(Alternating Minimization, AM算法)

AM算法：给定一个初值，交替的固定一个变量，优化其他的，主要求解无约束优化．对于二元函数，AM算法在双稳定点（bistable　point）停止，但有两个问题需要考虑的１）收敛到双稳定点的速度，即算法收敛阶２）收敛到的双稳定点是否是全局最小点AM算法迭代没有参数，不必花时间调整参数，但也意味着用户对算法进程控制更少．AM算法的收敛性完全依赖优化问题的结构性质．有界目标函数有多个双稳态点，AM最终收敛的稳定点取决于初始点的位置．当AM算法求解学习隐变量模型，矩阵填充（子问题是边缘凸），相位恢复问题
复制链接

扫一扫