一种点到特定高维平面的距离的优化算法

最新推荐文章于 2021-03-23 11:06:46 发布

海渺与群

最新推荐文章于 2021-03-23 11:06:46 发布

阅读量416

点赞数

文章标签：增广拉格朗日

本文链接：https://blog.csdn.net/weixin_43722782/article/details/102760199

版权

一种点到特定高维平面的距离的优化算法

文章目录

一种点到特定高维平面的距离的优化算法

该算法来自于Efﬁcient Projections onto the ℓ1-Ball for Learning in High Dimensions论文，优化问题为：

\underset{\bm{w}}{minmize}\frac{1}{2}\|\bm{w}-\bm{v}\|_2^2\ s.t.\sum_{i=1}^mw_i=z,w_i\geq0

其中

\bm{w}

和

\bm{v}

均为向量。
解决方法如下：

step1

构造拉格朗日函数
$L(w,\delta)=\frac{1}{2}\|\bm{w}-\bm{v}\|^2_2+\theta(\sum_{i=1}^nw_i-z)-\bm{\delta}\cdot\bm{w},s.t. \ \delta_i\geq0$

step2

关于 $w_i$ 求偏导，令导数为0，可以得到 $w_i$ 的计算式：
$w_i=v_i-\theta+\delta_i$
同时根据KKT方程可以得知，若 $w_i>0$ 则必有 $\delta_i=0$ ；
所以若 $w_i>0$ ，则 $w_i=v_i-\theta$ 。

step3

引入一个定理：
定理1：对于最开始的优化问题，若 $\bm{w}$ 是最优解向量，那么对任意的下标 $i, j$ 若满足 $v_i>v_j$ ，那么若 $w_i=0$ 则 $w_j=0$ 。（论文中所给的定理）
由这个定理可以得出一种方法：若将 $\bm{v}$ 按照从大到小的形式重新排列，并且 $\bm{w}$ 根据 $\bm{v}$ 的重排进行相应的重排，那么可以知道若 $w_i=0$ ，则 $i$ 下标以后的所有值均为0。设重排后的向量为 $w^{(1)}$ 和 $v^{(1)}$ 代入等式约束中可以求出 $\theta$ 的值，即由 $\sum_{i=1}^n w^{(1)}_i=\sum_{i=1}^\rho w^{(1)}_i=z$ 可得到 $\theta=\frac{1}{\rho}(\sum_{i=1}^{\rho} v^{(1)}_{i}-z)$ ，其中 $\rho$ 为重排后 $\bm{w}$ 中大于0的元素的个数，即最后一个大于0的元素对应的下标。
而得到 $\theta$ 后可以得到 $w_i=max\{v_i-\theta,0\}$ 。

step4

接下来需要确定一个最优的 $\rho$ ，方法一是 $\rho$ 从1到n进行枚举，可以认为是一个 $O(n^2)$ 的复杂度。
方法二给出第二个定理：
定理二：若 $\bm{w}$ 为最优解向量，那么可以得到 $\rho$ 的计算式为：
$\rho(z,\mu)=max\{j\in[n]:v^{(1)}_j-\frac{1}{j}(\sum_{r=1}^jv^{(1)}_r-z)>0\}$
根据定理二的式子可以得出求 $\rho$ 可以采用二分的方法，这样复杂度可以降到 $O (n l o g n)$ 。

因而整理下所有的思路为：
输入：向量 $\bm{v}$ 和值 $z > 0$ 。

首先将向量 $\bm{v}$ 降序排列为 $\bm{v}^{(1)}$ ： $v^{(1)}_1>=v^{(1)}_2>=\cdots>=v^{(1)}_n$ 。
二分寻找 $\rho(z,\mu)=max\{j\in[n]:v^{(1)}_j-\frac{1}{j}(\sum_{r=1}^jv^{(1)}_r-z)>0\}$ 。
计算 $\theta=\frac{1}{\rho}(\sum_{i=1}^{ \rho}v^{(1)}_i-z)$ 。
得到输出： $w_i=max\{v_i-\theta,0\}$ 。

海渺与群

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
一种点到特定高维平面的距离的优化算法

该算法来自于Efﬁcient Projections onto the ℓ1-Ball for Learning in High Dimensions论文，优化问题为：minmizew12∥w−v∥22 s.t.∑i=1mwi=z,wi≥0\underset{\bm{w}}{minmize}\frac{1}{2}\|\bm{w}-\bm{v}\|_2^2\ s.t.\sum_{i=1...
复制链接

扫一扫