MDS（Multidimensional Scaling）

最新推荐文章于 2023-12-06 18:01:49 发布

totodum

最新推荐文章于 2023-12-06 18:01:49 发布

阅读量7.8k

点赞数 6

分类专栏：机器学习文章标签：算法

本文链接：https://blog.csdn.net/totodum/article/details/51097329

版权

机器学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

MDS的主要思想

MDS的目的是降维。怎么降才能使损失的信息更少呢？我们想到，如果降到低维后，所有点之间的距离还和高维时点间距离相同，那么就可以大致认为我们保留下来了原来的信息。

算法具体内容

通过输入的高维点集（I个点），可以得到距离矩阵：

这里写图片描述

降维后的点集：{xi, i=1, 2, …, I}

我们要想办法，使得降维后的点生成的距离矩阵和高维点距离矩阵尽量相同。即，

这里写图片描述

算法推导

构造降维后点集的矩阵，

X = ⎛ ⎝ ⎜ ⎜ ⎜ ⎜ ⎜ x T 1 x T 2 ⋮ x T I ⎞ ⎠ ⎟ ⎟ ⎟ ⎟ ⎟

$X = \begin{gather*} \begin{pmatrix} x_1 ^ \mathrm{ T }\\ x_2 ^ \mathrm{ T }\\\vdots\\x_I^ \mathrm{ T } \end{pmatrix}\\ \end{gather*}$
定义矩阵T，

T = X X T

$T = XX ^ \mathrm{ T }$
其中，

t i j = x i x j

$t_{ij} = x_ix_j$
对于距离矩阵，

δ 2 i j = (x i - x j) 2 = x 2 i + x 2 j - 2 x i x j

$\delta_{ij}^2=(x_i - x_j)^2=x_i^2+x_j^2-2x_ix_j$

t i j = - 1 2 (δ 2 i j - x 2 i - x 2 j)

$t_{ij}=-\dfrac{1}{2}(\delta_{ij}^2-x_i^2-x_j^2)$

\sum j δ 2 i j = n x 2 i + \sum j x 2 j - 2 x i \sum j x j = n x 2 i + \sum j x 2 j

$\sum_j\delta_{ij}^2=nx_i^2+\sum_jx_j^2-2x_i\sum_jx_j=nx_i^2+\sum_jx_j^2$

\sum i δ 2 i j = n x 2 j + \sum i x 2 i - 2 x j \sum i x i = n x 2 j + \sum i x 2 i

$\sum_i\delta_{ij}^2=nx_j^2+\sum_ix_i^2-2x_j\sum_ix_i=nx_j^2+\sum_ix_i^2$

\sum i j δ 2 i j = n \sum i x 2 i + n \sum j x 2 j

$\sum_{ij}\delta_{ij}^2=n\sum_ix_i^2+n\sum_jx_j^2$
如果我们提前对X进行去均值化的话，就有，

\sum j x j = \sum i x i = 0

$\sum_jx_j = \sum_ix_i=0$

联立以上各式，可以求得矩阵T。
注意到，

T = X X T

$T = XX ^ \mathrm{ T }$
对T进行特征分解，

T = U Λ U T

$T = U\Lambda U ^ \mathrm{ T }$
即可得到X，也就是降维后的点集。

X = U Λ - - \sqrt

$X = U\sqrt\Lambda$

python代码实现

自己写了一个小函数实现mds。觉得麻烦的朋友可以直接去网上找一找相关的python库，好像是有封装好的函数的。

"""
Author: totodum
Program: Multidimensional_Scaling.py
Description: Multidimensional Scaling algorithm
"""
from numpy import *
from numpy.linalg import *


'''
MDS take the distance matrix d and reduce the dimension to 'dimension'
    return the result vector of dimension 'dimension'
'''


def mds(d, dimension):
    (n, n) = shape(d)
    t = zeros((n, n))
    d_square = d**2
    d_sum = sum(d_square)
    d_sum_row = sum(d_square, axis=0)
    d_sum_col = sum(d_square, axis=1)
    for i in range(n):
        for j in range(n):
            t[i, j] = -(d_square[i, j] - d_sum_row[i]/n - 
                        d_sum_col[j]/n + d_sum/(n*n))/2
    [U, S, V] = svd(t)
    X_original = U * sqrt(S)
    X = X_original[:, 0:dimension]
    return X