tSNE的思考

最新推荐文章于 2022-05-18 11:16:06 发布

V丶Chao

最新推荐文章于 2022-05-18 11:16:06 发布

阅读量2.6k

点赞数 1

分类专栏：机器学习文章标签：可视化机器学习人工智能 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u011698800/article/details/114699385

版权

机器学习专栏收录该内容

43 篇文章 4 订阅

订阅专栏

20210312 -
（）

0. 引言

虽然一直在使用TSNE进行数据的可视化，但是都没有具体探究过这个算法的具体原理；同时呢，有时候也会遇到一些很奇葩的数据。
在网上看别人进行TSNE的实际操作，每次画出来数据都特别好看，但是为什么到了我这里的数据，就看起来非常难看？！本篇文章记录一些这方面的内容来进行思考。

1. 具体原理

关于他的具体原理，这里不再过多的去看大量的文章，这里找到一个文章，虽然在数学的部分不怎么理解，但是从他的描述上，我感受到这样一种思想，本质上可视化的过程，是要找到一种映射，这种映射实现的功能就是，在原始空间中两个点距离近，那么在新的空间中也会近。最后达到一个稳定的状态。
（不知道理解的对不对）
在这里插入图片描述
特别是后面的这个达到稳定状态的过程，在文章的最后有一个动图能够体现这个过程，这里不贴了，有兴趣可以直接去看。

2. 可分的思考

那么既然这样的话，平时经常遇到一个问题，那就是对分类问题的数据进行tSNE可视化，结果都显示不可分，这种情况怎么办？网上的一些例子，都是利用一些比较好分的数据来进行这个算法的展示，例如前面这个图，虽然不能说完全的线性可分，但是基本上没有太大的难度，分类出来的效果应该也挺高。

但是假如说，通过tSNE可视化出来的数据，非常差，基本上看不到什么可分的迹象，那这种情况应该怎么办？针对这个问题，我查了一些资料。在问答[2]中给出了一些解释，我感觉还算中肯。

答：存在两种层面的解释，理论层面，存在某种分类器，即使他们在这个角度上是混合在一起的，他们依然能够分开；在实际层面，出现这种情况，也代表着能够分开的可能性比较低，通过一些非线性的模型，或者集成，或者堆叠的模型可以帮助提升效果。

从这个解释上来看，那基本上就是没什么戏，虽然可以尝试集成学习。

参考

[1]An illustrated introduction to the t-SNE algorithm

[2]Is it indistinguishable if t-SNE method does not show clear two clusters (for 2-class classification problem)?

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。