李宏毅老师课程:Unsupervised Learning:Neighbor Embedding

Manifold Learning(流形学习)

在高维空间里,距离该点很远的点很可能与这个点也是有关联的,因此我们可以把3-D的空间进行降维,那么我们就可以更方便地进行clustering或unsupervised learning 任务
在这里插入图片描述

Locally Linear Embedding (LLE)(局部线性嵌入)

在这里插入图片描述
在这里插入图片描述

Laplacian Eigenmaps(拉普拉斯特征图)

Review:在之前的semi-supervised learning中,如果两个点 x 1 x^1 x1 x 2 x^2 x2在高密度区域上是相近的,那它们的label y 1 y^1 y1 y 2 y^2 y2很有可能是一样的
在这里插入图片描述
我们也可以得出类似smoothness的式子,计算 z i , z j z^i,z^j zi,zj之间的smoothness
在这里插入图片描述
那么我们现在的目标就是找到 z i , z j z^i,z^j zi,zj,来使S达到最小值,还需要有一些额外的constrains

现在我们对z加入一些constrains,如果降维后z的维数是M,那么我们就不希望取出来的这些点还生活在比M还低维的空间里面;我们现在希望把塞进高维空间的低维空间展开,我们就不希望展开之后的点在一个更低维的空间里面

T-distributed Stochastic Neighbor Embedding (t-SNE)

对于之前的LLE方法,类似的data之间是很close的,但不同类别之间的data却没有分开,是叠成一团的
在这里插入图片描述
为了找到对应的 z i , z j z^i,z^j zi,zj P , Q P,Q P,Q两个分布应该越接近越好
在这里插入图片描述
可以使用gradient descent,有了L函数,再分别对 z i , z j z^i,z^j zi,zj求偏微分即可

但t-SNE要对所有的point之间都求similarity,因此计算量比较大,在数据量很大的情况下电脑的计算速度会非常慢

因此,对于很高的dimensions,通常先做降维(PCA),比如可以降维到50维,再使用t-SNE降到2维

通常我们使用t-SNE来对高维的数据进行可视化
在这里插入图片描述
在上图中,红色曲线表示SNE,蓝色曲线表示t-SNE,纵轴表示distribution

如果本来就离得很近,那么经过t-SNE之间的距离还是很小;如果本来就离得很远,那么从原来的distribution拉到t-SNE之后,距离会更远;

到实际的例子中,如果本来是同一个类别的data,由于这些data之间的距离很近,不会收到t-SNE很大的影响;但如果是属于不同类别的data,距离是比较远的,t-SNE会放大这种距离

对于下图中的MNIST,先使用PCA进行降维,再进行可视化,就可以得到下图中的good visualization
在这里插入图片描述

本文图片来自李宏毅老师课程PPT,文字是对李宏毅老师上课内容的笔记或者原话复述,在此感谢李宏毅老师的教导。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值