- 博客(1)
- 收藏
- 关注
转载 科研中常用的十种数据降维方法(摘自知乎)
其中,第一个新坐标轴选择是原始数据中方差最大的方向,第二个新坐标轴选取是与第一个坐标轴正交的平面中使得方差最大的,第三个轴是与第1,2个轴正交的平面中方差最大的。t-随机邻近嵌入,它是一种嵌入模型,能够将高维空间中的数据映射到低维空间中,并保留数据集的局部特性,当我们想对高维数据集进行分类,但又不清楚这个数据集有没有很好的可分性(同类之间间隔小、异类之间间隔大)时,可以通过t-SNE将数据投影到2维或3维空间中观察一下:如果在低维空间中具有可分性,则数据是可分的;因此,所有的数据列方差小的列被移除。
2023-08-01 19:24:33
2494
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人