Convex-ConCave Procedure（CCCP）凹凸规划高效的问题分解求解方法

最新推荐文章于 2024-09-05 21:01:34 发布

再给一碗吧

最新推荐文章于 2024-09-05 21:01:34 发布

阅读量5.2k

点赞数 2

分类专栏：机器学习理论知识文章标签：线性代数算法机器学习

本文链接：https://blog.csdn.net/qq_35155934/article/details/120632000

版权

机器学习理论知识专栏收录该内容

15 篇文章

订阅专栏

本文介绍了CCCP算法在处理DC函数（差分凸函数）优化中的应用，通过分解目标函数为凸凹组合，解决非凸问题。算法通过迭代逼近梯度匹配点，适用于实施数学规划。注意CCCP的双层循环可能导致效率问题，适合初步理解ramploss优化策略。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

最近接触了 ramp loss
这个loss 优劣参半，很烦的就是这个函数它虽然连续和鲁棒，但是不可微非凸
DC分解以及 CCCP规划在这个问题上就蛮适用

下面的内容，主要来自：
参考网址1
参考网址2
以及一篇外刊
记录下来，方便学习。

CCCP规划，本质上是寻找两个凸函数之间梯度相同的两个点，即逐步减小两个函数之间的距离，使其收敛到距离最接近的点。
保留了目标函数的部分凸性，对非凸的部分进行线性化处理，进而通过迭代求解目标函数的一系列凸的子问题，进而得到原目标函数的驻点。

Convex-Concave procedure(凹凸过程)

CCCP是一种单调递减全局优化的方法。其形式可以表示为凸函数-凸函数或者凸函数+凹函数。

————————————

一、问题模型：DC(difference of convex)问题/规划

令f是一个DC函数，定义存在凸函数, $:{R^{n}\rightarrow R}$ ,使得f可以被分解为g和h之间的差值：
分解形式
对于DC问题：
DC描述
在这里 $f_i:R^n\rightarrow R对于{ i } = 0 , \dots , \mathbf { m }$ 是一个可导的DC函数。本文探讨使用CCCP算法来优化这一问题
————————————

二、CCCP

假设一个能量函数E(x)，其Hessian矩阵(二阶偏导矩阵)有界，y写成 $E(x)=E_{cave}(x)+E_{vex}(x)$ 形式。
在这里插入图片描述
接下来证明该优化形式以及过程是收敛的：

证明：∀F(x) 是凸的，Hessian 矩阵F(\vec x) > 0，由于其Hessian矩阵有界，所以 $\exists\lambda>0,Hessian矩阵E(\vec x)+\lambda F(\vec x))>0,则E(\vec x)+\lambda F(\vec x)是凸的。所以 E(x)可以写成E(x) = E(\vec x)+\lambda F(\vec x) +(- \lambda F(\vec x))$

其次，对于一个函数 $E(x)=E_{cave}(x)+E_{vex}(x)$ ，则离散迭代CCCP算法 $\vec {x}^t\rightarrow \vec{X}^{t+1}$ 为：
在这里插入图片描述

证明收敛：如果函数 $E_{vex}(\cdot)和E_{cave}(\cdot)$ 分别为凸函数和凹函数，下为证明和示意图。

在这里插入图片描述
图中表示为两个凸函数上面假设为E1,下面为E2,，本质上寻找两个凸函数之间梯度相同的两个点就是在逐步减小两个函数之间的距离，使其收敛到距离最接近的点。首先在E2找到一个x0,寻找E1中与x0梯度相同的点，投影到E2上，一直重复下去，直到收敛到最小距离的点(图中为5.0)。

根据以上理论，凹凸问题相减问题可以得到解决。首先在这个算法中，应该设置初始点x_0,然后线性初始化凹陷部分函数，可以把x_{k+1}设置为上面凸函数的解，通过迭代优化进行收敛，找到全局最优点。
————————————

三总结

在实际应用中，经常把两个函数利用线性约束/正则化写成两个凸函数相减的形式，进行优化。但是由于CCCP会有两层循环，一层优化 $\arg \min _ { \theta } \left( E _ { \mathrm { vex } } ( \theta ) + E _ { \mathrm { cav } } ^ { \prime } \left( \theta ^ { i } \right) \cdot \theta \right)，$ 一层分别对凸函数进行梯度下降，程序速度会比较慢。