流形学习漫谈一:多维缩放(Multiple Dimensional Scaling, MDS)

降维算法是机器学习中的重要一部分,通常用的比较多的算法有线性判别分析(LDA)与主成分分析(PCA)等。在此基础上,还有中算法,即流形学习,在计算机视觉中有着广泛的应用。由于直接计算高维特征空间的距离具有很高的错误率(如图所示,高维空间的距离并不合理),例如,在现实生活中,计算北京到华盛顿之间的距离,如果直接透过地球内部直接计算两点之间直线距离是不合适的,最好的办法是围绕地球表面,在微小的局部上计算直线距离,然后将所有局部距离加起来才更合理。即高维曲面上的两点距离最好的计算方法是通过计算局部空间近邻距离的方式更为合理。

测地线距离

而在流形学习中,常见的算法有Isometric Mapping(即等度量映射),局部线性嵌入(Locally Linear Embedding)等,其中在介绍Isometric Mapping算法之前,需要先介绍一下多维缩放算法(MDS),MDS算法与PCA算法均为降维算法的一种。其主要思想是构造低维空间的内积矩阵,使得该内积矩阵中所表达的任意两点之间的距离与高维空间的相应两点距离相等,然后通过对该内积矩阵进行正交特征值分解,析出两个矩阵相乘(即矩阵与矩阵的转置进行相乘)的形式,获得最终的变换矩阵

现假设有m个样本的高维空间的距离矩阵为D = \{ dis{t_{ij}}|1 \le i,j \le m\} \in {​{\rm{R}}^{​{\rm{m}} \times {\rm{m}}}},其中dis{t_{ij}}表示样本x_i与样本x_j之间的距离。而我们的目标是在低维空间的表示Z \in R^{d^{'} \times m}d^{'}\ll d,同时,还要满足高维空间的对应两个样本点在低维空间之间同样相等,即\left \| z_i -z_j \right \| = dist_{ij}

现假设低维空间的内积矩阵为B=\{b_{ij}|1 \le i,j \le m\}=Z^TZ \in R^{m \times m},其中b_{ij}=z_i^Tz_j,即表示低维空间两点之间的距离。

接下来的几步西瓜书上的推导其实就是在凑出一种形式,使其满足上面对应的高维空间两点与低维空间两点距离相等的条件。

由于直接衡量距离比较困难,即对于

  • 0
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值