t-SNE的正确打开方式

t-SNE是高维数据可视化的重要工具,其原理在于通过非线性变换保持高维数据的局部结构。关键参数perplexity影响结果,应根据数据密度在5到50之间调整。注意,t-SNE不能展示集群相对大小,不同集群间的距离无明确含义,且小的点群可能是噪声。实际应用中,建议先用PCA等方法预处理数据。t-SNE适合启发式分析,不适合作为实验结果评估标准。
摘要由CSDN通过智能技术生成

引言

t-SNE是可视化高维向量的常用手段,但是盲目调用sklearn包并不是t-SNE的正确打开方式,知其然还要知其所以然,这样才能基于正确的可视化结果得到可能正确的猜想。

参考文章:
1.https://towardsdatascience.com/why-you-are-using-t-sne-wrong-502412aab0c0
2.http://deeplearning.csail.mit.edu/slide_cvpr2018/laurens_cvpr18tutorial.pdf
3.https://distill.pub/2016/misread-tsne/

1、t-SNE的原理(简介)

The reason t-SNE is common for visualization is that the goal of the algorithm is to take your high dimensional data and represent it correctly in lower dimensions — thus points that are close in high dimensions should remain close in low dimensions. It does this in a no

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值