多维缩放算法(MDS)

算法思想

MDS算法思想很简单,一句话就是保持样本在原空间和低维空间的距离不变。

因为距离是样本之间一个很好的分离属性,对于大多数聚类算法来说,距离是将样本分类的重要属性,因此当我们降维后,保持距离不变,那么就相当于保持了样本的相对空间关系不变。

MDS算法

假设 m m 个样本在原始空间中的距离矩阵为DRmm distij d i s t i j xi x i xj x j 之间的距离,我们的目标就是获得样本在 d d ′ 维空间中的表示 ZRdm,dd Z ∈ R d ′ ∗ m , d ′ ≤ d ||zizj||2=distij | | z i − z j | | 2 = d i s t i j ,即两个空间中,样本间距离保持不变。

B=ZZT B = Z Z T 为降维后的内积矩阵, 则 Bij=zizTj B i j = z i z j T

dist2ij=||zizj||2=||zi||2+||zj||22zTizj=bii+bjj2bij d i s t i j 2 = | | z i − z j | | 2 = | | z i | | 2 + | | z j | | 2 − 2 z i T z j = b i i + b j j − 2 b i j

当我们对 Z Z 做过中心化,即i=1mzi=0,则有矩阵B的行和列的和均为0,即:

mi=1bij=mj=1bij=0 ∑ i = 1 m b i j = ∑ j = 1 m b i j = 0

因此有:

mi=1dist2ij=mi=1||zizj||2=mi=1bii+mi=1bjj2mi=1bij=tr(B)+mbjj0 ∑ i = 1 m d i s t i j 2 = ∑ i = 1 m | | z i − z j | | 2 = ∑ i = 1 m b i i + ∑ i = 1 m b j j − 2 ∑ i = 1 m b i j = t r ( B ) + m b j j − 0

mj=1dist2ij=tr(B)+mbii ∑ j = 1 m d i s t i j 2 = t r ( B ) + m b i i

所以:

mi=1mj=1dist2ij=mi=1tr(B)+mmi=1bii=2mtr(B) ∑ i = 1 m ∑ j = 1 m d i s t i j 2 = ∑ i = 1 m t r ( B ) + m ∑ i = 1 m b i i = 2 m t r ( B )

令:

dist2i=1mmj=1dist2ij d i s t i ⋅ 2 = 1 m ∑ j = 1 m d i s t i j 2

dist2j=1mmi=1dist2ij d i s t ⋅ j 2 = 1 m ∑ i = 1 m d i s t i j 2

dist2=1m2mi=1mj=1dist2ij d i s t ⋅ ⋅ 2 = 1 m 2 ∑ i = 1 m ∑ j = 1 m d i s t i j 2

有:

bii=1m(mj=1dist2ijtr(B)) b i i = 1 m ( ∑ j = 1 m d i s t i j 2 − t r ( B ) )

bjj=1m(mi=1dist2ijtr(B)) b j j = 1 m ( ∑ i = 1 m d i s t i j 2 − t r ( B ) )

所以有:

bij=12(bii+bjjdist2ij)=12(dist2ijbiibjj)=12(dist2ijdist2idist2j+2mtr(B)) b i j = 1 2 ( b i i + b j j − d i s t i j 2 ) = − 1 2 ( d i s t i j 2 − b i i − b j j ) = − 1 2 ( d i s t i j 2 − d i s t i ⋅ 2 − d i s t ⋅ j 2 + 2 m t r ( B ) )

而:

tr(B)=12mmi=1mj=1dist2ij t r ( B ) = 1 2 m ∑ i = 1 m ∑ j = 1 m d i s t i j 2

所以有:

bij=12(dist2ijdist2idist2j+dist2) b i j = − 1 2 ( d i s t i j 2 − d i s t i ⋅ 2 − d i s t ⋅ j 2 + d i s t ⋅ ⋅ 2 )

因此我们可以通过矩阵 D D 求得矩阵B,而 B=ZZT B = Z Z T ,对 B B 做特征分解,有:

B=PΛPT

可以得到:

Z=Λ12PT Z = Λ 1 2 P T

矩阵 Z Z <script type="math/tex" id="MathJax-Element-61">Z</script>就是样本在低维空间的映射

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值