扩散映射(diffusion map)
本文出发点: 在论文<constraints as features>中,将 不连约束 的添加 转为 特征空间的增广,用到了样本在扩散空间的分布,而扩散空间的分布是由扩散映射得到的。
注:蓝色是我的想法,不一定正确
扩散映射是一种降维方法
1. 其通过 整合数据的局部几何关系 揭示 数据集在不同尺度的几何结构。
2. 与PCA (principal component analysis)、MDS (Multidimensional Scaling) 这些降维方法相比,扩散映射 非线性,聚焦于发现数据集潜在的流形结构。
3. 优点:对噪声鲁棒,计算代价较低
4. 计算扩散映射的方法:
step1, 计算高斯核矩阵; (若t>1,则计算该矩阵的t次方)
step2,计算扩散矩阵(将核矩阵的行归一化);
step3,计算扩散矩阵的特征值和特征向量;
step4, 映射到d维扩散空间 -- 在时刻t时,只取前d个特征值和特征向量。
扩散距离 Yi' 如下:
是矩阵 P 的 first-enginvector 的 第i个元素
5. R中如何使用
调包 library(diffusionMap)
6. t值
- Pt(x,y) -- 从 x 经 t 步走到y
(
一般取第t轮迭代的kenel matrix。
联系markov链,矩阵 Pt 就是把 transition matrix 矩阵的 t 次方)
- 若增大t值,就进一步地扩散了每个点的近邻的影响;
- 若x,y之间有多条路径,其扩散距离就很小;
【参考】
(点1~4 ,来自参考[1])
[1] De la Porte J, Herbst B M, Hereman W, et al. An introduction to diffusion maps[C]//Proceedings of the 19th Symposium of the Pattern Recognition Association of South Africa (PRASA 2008), Cape Town, South Africa. 2008: 15-25.
(点6,来自参考[2])
[2] Lafon S, Lee A B. Diffusion maps and coarse-graining: A unified framework for dimensionality reduction, graph partitioning, and data set parameterization [J]. IEEE Trans on Pattern Analysis and Machine Intelligence, 2006, 28(9): 1393-1403.