课程笔记——Unsupervised Learning:Neighbor Embedding

Manifold Learning(流形学习)

理解:流形学习就是将高维数据恢复成低维流形结构,即找到高维空间中的低维流形,并求出相应的嵌入映射,以实现维数约简或者数据可视化。

在比较近的距离中欧式距离可以使用(如蓝色区域的几个点),在较远距离中欧式距离不适用(如蓝色区域点-黄色区域点欧式距离>蓝色区域点-红色区域点欧式距离,但从 Manifold角度看从蓝色区域走到黄色区域距离较近)
在这里插入图片描述

若我们可以将数据降维,这样就方便使用欧式距离了。接下来讲一系列的非线性降维方法,凭借降维前的空间中 每个点和它邻居的关系来降维。


1 Locally Linear Embedding局部线性嵌入

过程

  • 在高维空间中, x i x^i xi有三个邻居点 x j x^j xj(红色圈处), x i x^i xi x j x^j xj存在某种关系 w i j w_{ij} wij
  • 假设 x i x^i xi可以通过 x j x^j xj线性组合得到
  • 找到一组 w i j w_{ij} wij,使得 ∑ i ∣ ∣ x i − ∑ j w i j x j ∣ ∣ 2 \sum_i||x^i-\sum_jw_{ij}x^j||_2 ixijwijxj2最小
  • 在低维空间中,固定 w i j w_{ij} wij不变,找出 z i z^i zi z j z^j zj,使得 ∑ i ∣ ∣ z i − ∑ j w i j z j ∣ ∣ 2 \sum_i||z^i-\sum_jw_{ij}z^j||_2 izijwijzj2最小。即基于 w i j w_{ij} wij,找到 x i x^i xi降维后的 z i z^i zi,以及 x j x^j xj降维后的 z j z^j zj
    在这里插入图片描述

注意

  • 在高维转换为低维时,通常距离近的点,其关系更稳定 不易改变。
  • 但是阈值我们不可知,选的邻居个数K不能过大/过小。K=5(过小),则维度展开不完全,降维效果不好。K=60(过大),则意味几乎跟每个邻居都作比,降维效果仍然不好。
    在这里插入图片描述

2 Laplacian Eigenmaps拉普拉斯特征图

思想
在高维空间中不可使用欧式距离计算的话,我们可以基于曲线图计算距离(Graph-based approach)。[此处需要回顾半监督学习-4.平滑假设-方法2,概要如下]
在这里插入图片描述
当用于无监督学习时
在这里插入图片描述

  • 为了防止 z i z^i zi= z j z^j zj=0,需要加约束条件,即假如现降维至M,则需要降维后的 z 1 . . . z N z^1...z^N z1...zN能够填满整个M维平面。即:Span { z 1 , z 2 , . . . , z N } \{z^1,z^2,...,z^N\} {z1,z2,...,zN} = R M R^M RM

3 T-distributed Stochastic Neighbor Embedding(t-SNE)t分布随机邻接嵌入

以上的方法均表明高纬度中距离较近的点,降维后距离依然很近。但是并未说明高纬度中距离较远的点,降维后会如何。举例:MNIST中不同颜色代表不同数字,LLE可将同样的数字聚在一起,但是并没办法将不同的数字分开。
在这里插入图片描述
做法
核心思想:前面的做法是尽量使相近的点降维后距离不变,而t-SNE方法是使降维后分布接近,即距离大的降维后仍然大,距离小的降维后仍然小。

  • 计算高维空间时,(i点-j点的相似度)÷(i点-所有点的相似度之和)
    在这里插入图片描述
  • 计算降维后,(i点-j点的相似度)÷(i点-所有点的相似度之和)
    在这里插入图片描述
  • 梯度下降法,使 L L L最小,补充:相对熵(又称KL散度),是描述两个概率分布差异的一种方法。
    在这里插入图片描述
    其中,计算相似度方法:
    高维度计算相似度公式为 S S S,低纬度计算相似度公式 S ′ S' S
    注意!t-SNE采用不同的相似度计算公式,目的是:当点相似度高时(A点),从高维→低维时距离仍小;当点相似度低时(B点),从高维→低维时距离急速变大。
    在这里插入图片描述
    在这里插入图片描述
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值