线性降维-笔记(2)

4 - MDS

MDS全称”Multidimensional Scaling”,多维缩放。其主要思想就是给定一个原始空间的,原始样本两两之间的距离矩阵;期望能在新空间中找到一个新的样本特征矩阵,使得其新样本两两之间的距离矩阵与原始的距离矩阵相等。因为 dd ,所以完成了降维的任务。

即假定有 m 个原始样本的距离矩阵为DRm×m,其第 i 行第j列元素 Dij 为样本 xi xj 之间的距离。以期望在 d 维空间中找到样本表示的矩阵 XRd×m ,其中 dd ,且任意两个样本在 d 维空间中的欧式距离等于原始空间中的距离,即 ||xixj||=Dij .
ps:MDS大多都还是使用的欧式距离来作为样本之间的测量方法,更多的方法看下面的表4.1.

D=XTXRm×m ,其中 D 为降维后样本的内积矩阵, Dij=xTixj ,则有:

D2ij===||xixj||2||xi||2+||xj||22xTixjDii+Djj2Dij(4.1)

假设求得的降维后样本已经中心化了,即 mix=mμx=0 ,则可以看出矩阵 D 的行之和等于列之和都为零,即
imDij=jmDij=0(4.2)

则4.2,4.1可得:
imD2ij===im(Dii+Djj2Dij)imDii+mDjj2imDijtr(D)+mDjj(4.3)

同理:
jmD2ij=tr(D)+mDii(4.4)

则:
imjmD2ij===im(tr(D)+mDii)mtr(D)+immDii2mtr(D)(4.5)

令:
D¯¯¯2i.=1mmjD2ij(4.6)
D¯¯¯2.j=1mmiD2ij(4.7)
D¯¯¯2..=1m2mimjD2ij(4.8)
由4.1-4.8得:
Dij===12(D2ijDiiDjj)12D2ij1mjmD2ij12mimjmD2ij1mimD2ij12mimjmD2ij12(D2ijD¯¯¯2i.D¯¯¯2.j+D¯¯¯2..)

从而可以计算得到降维后的样本距离矩阵 D
对矩阵 D 做特征值分解, D=VΛVT ,其中 Λ=diag(λ1,λ2,...λd) 为特征值构成的对角矩阵,且按照从大到小排序, V 为特征向量矩阵,假设其中有 d 个非零特征值,则构成对角矩阵 Λ=diag(λ1,λ2,...λd) ,令 V 表示对应的特征向量矩阵,则 X 可得:
X=Λ1/2VTRd×m

表4.1 定量数据之间的相关性测量

距离测量式 子
欧式距离 Drs={di(xrixsi)2}1/2
权重欧式距离 Drs={diwi(xrixsi)2}1/2
马氏距离 Drs={(xrxs)TΣ1(xrxs)}1/2
City block测量 Drs=di|xrixsi|
Minkowski测量 Drs={diwi|xrixsi|λ}1/λλ1
Canberra测量 Drs=di|xrixsi|xri+xsi
Divergence Drs=1ddi(xrixsi)2(xri+xsi)2
Bray-Curtis Drs=1ddi|xrixsi|di(xri+xsi)
Soergel Drs=1ddi|xrixsi|dimax(xri,xsi)
Bhattacharyya距离 Drs=di((xri)(xsi))2
Wave-Hedges Drs=di(1min(xri,xsi)max(xri,xsi))
Angular separation Drs=1dixrixsi[dix2ridix2si]1/2
Correlation Drs=1di(xrix¯r)(xsix¯s)[di(xrix¯r)2di(xsix¯s)2]1/2
5 - ICA
6 - LFA
7 - LPP

参考文献:
[] 周志华 机器学习
[] Michael A.A. Cox, Trevor F. Cox. Multidimensional Scaling

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值