最大边界降维算法(large margin dimensionality reduction)

最新推荐文章于 2021-11-25 10:29:21 发布

luixiao1220

最新推荐文章于 2021-11-25 10:29:21 发布

阅读量346

点赞数

分类专栏：算法

本文链接：https://blog.csdn.net/luixiao1220/article/details/106374242

版权

算法专栏收录该内容

33 篇文章 2 订阅

订阅专栏

UTF8gbsn

本文介绍一种非常简单的降维算法, 叫做最大边界降维算法.

背景

加入你有一个向量的集合 $S=\{ \mathbf{x}_1, \mathbf{x}_2, \cdots, \mathbf{x}_n \}$
,其中 $\mathbf{x}_i$ , 是一个 $n\times 1$ 的向量.
并且每一个向量 $\mathbf{x}_i$ 具有一个类别 $label_i$ .
那么如何来降维并使得不同的向量在计算欧式距离时满足以下条件:

类标相同的向量欧式距离应该越小.
类别不同的向量欧式距离应该越大.

建立代价函数

首先,我们明确以下,
我们希望将向量 $\mathbf{x}_{n\times 1}$ 降低到 $\mathbf{m\times 1}$ 的维度,
其中 $n\gg m$ .
其次,我们定义一个线性变换矩阵 $W_{m\times n}$ , 它可以进行变换 $Wx_i$ ,
将 $x_i$ 从一个n维度的向量变换位一个 $m$ 维度的向量.
最后, 为了使得边界最大化, 定义一个代价函数
$y_{i j}\left(b-d_{W}^{2}\left(x_{i}, x_{j}\right)\right)>1$

其中, $d_{W}^2(x_i,x_j)=\|Wx_i-Wx_j \|^2=(x_i-x_j)^TW^TW(x_i-x_j)$ ,
其中 $y_{ij}=1$ ,如果 $x_i,x_j$ 含有相同的label, 反之 $y_{ij}=-1$ .
b是个margin控制变量.

最后我们可以定义我们的优化任务为

$\arg \min _{W, b} \sum_{i,j}max[1-y_{ij}(b-(x_i-x_j)^TW^TW(x_i-x_j)),0]$

求解

对于上面的代价函数, 比较好的办法是采用随机次梯度下降算法.
因为不能保证代价函数为凸函数.
因为只有当 $y_{ij}(b-d_{W}^2(x_i, x_j))\leqslant 0$ 时,
代价函数的对应项位0.
所以我们只考虑 $y_{ij}(b-d_{W}^2(x_i, x_j))> 0$ 的情况.
设 $C(W,b)=1-y_{ij}(b-(x_i-x_j)^TW^TW(x_i-x_j)),$ ,
下面我们分别对 $W, b$ 求导,可得 $\left\{ \begin{aligned} &\frac{\partial C(W,b)}{\partial b}=-y_{ij}&,& \quad iff \quad y_{ij}(b-d_{W}^2(x_i, x_j))\leqslant 1\\ &0\quad \quad \quad &,& \quad otherwise \end{aligned} \right.$

$\left\{ \begin{aligned} &\frac{\partial C(W,b)}{\partial w}=y_{ij}W(x_i-x_j)(x_i-x_j)^T&,&\quad iff \quad y_{ij}(b-d_{W}^2(x_i, x_j))\leqslant 1\\ &\mathbf{0} \quad \quad \quad &,& \quad otherwise \end{aligned} \right.$

那么我们可以得到一个迭代关系位 $b_{t+1}=\left\{ \begin{aligned} &b_t\quad \quad \quad &,& \quad iff \quad y_{ij}(b-d_{W}^2(x_i, x_j))> 1\\ &b_t+\gamma y_{ij}&,&\quad otherwise \end{aligned} \right.$

$W_{t+1}=\left\{ \begin{aligned} &W_t\quad \quad \quad &,& \quad iff \quad y_{ij}(b-d_{W}^2(x_i, x_j))> 1\\ &W_t-\gamma y_{ij}W_t(x_i-x_j)(x_i-x_j)^T \quad &,&\quad otherwise \end{aligned} \right.$

The End

关于W的初始化, 可以采用PCA分析, 提取前m条主元, 来构成W的初始矩阵. 再次基础上进行迭代.
在测试集合上迭代到一定的条件的时候可终止, 也可以在迭代固定次数的时候终止.

luixiao1220

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
最大边界降维算法(large margin dimensionality reduction)

UTF8gbsn本文介绍一种非常简单的降维算法, 叫做最大边界降维算法.背景加入你有一个向量的集合S={v1,v2,⋯ ,vn}S=\{ \mathbf{v}_1, \mathbf{v}_2, \cdots, \mathbf{v}_n \}S={v1,v2,⋯,vn},其中xi\mathbf{x}_ixi, 是一个n×1n\times 1n×1的向量.并且每一个向量xi\mathbf{x}_ixi具有一个类别labelilabel_ilabeli.那么如何来降维并使得不同的向量在计算
复制链接

扫一扫