Diffusion Map扩散映射

最新推荐文章于 2025-02-01 12:48:24 发布

tzc_fly

最新推荐文章于 2025-02-01 12:48:24 发布

阅读量4.9k

点赞数 5

分类专栏：生物计算工具文章标签：矩阵概率论算法

本文链接：https://blog.csdn.net/qq_40943760/article/details/125055641

版权

生物计算工具专栏收录该内容

66 篇文章

订阅专栏

DiffusionMap是一种非线性降维方法，利用随机行走的diffusion过程来转换空间距离为转移概率。它通过计算细胞间的距离构建Markov矩阵，然后进行特征值分解以降维，揭示细胞的发育轨迹。特征值的重要性反映发育特征，选择前几个特征向量即可实现低维表示，用于理解高维数据的结构。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

扩散映射是一种非线性降维的方法。

Diffusion map使用了diffusion process的方法，假设黄色数据点a为热源，它可以扩散到其他点，扩散是随机行走的过程，如果目标距离热源远，则扩散概率小，反之扩散概率大。

diffusion process将空间距离转换为状态转移概率，从而确定随机行走的方向，确定细胞发育轨迹。
fig2
算法分为确定细胞转移方向（Markov矩阵）和降维（Markov矩阵特征值分解降维）两块；

如图所示，红色为目标细胞，在目标细胞周围有一些细胞，那么Diffusion Map首先计算这些细胞两两之间的距离，如果两个细胞距离较大，那么扩散概率就小，如果两个细胞距离较小，那么扩散概率就大。再将其转换为Markov矩阵，Markov矩阵表示某细胞向其他细胞转移的概率，因此在网络图中，边的权重可以用Markov矩阵中的元素表示：
fig3
如上图所示，对于邻近的几个细胞来说，当距离矩阵换算为Markov矩阵后，里面的元素代表细胞间扩散转移的概率，比如 $M_{12}$ 代表cell_1向cell_2转移的概率； $M_{13}$ 代表cell_1向cell_3转移的概率。距离远的细胞转移概率比较小，距离近的细胞转移概率比较大。

距离可以是节点之间特征的距离；

因此Markov矩阵表示细胞随机转移的方向，进而特征值分解降维到二维即可看出细胞的发育轨迹。

假设数据集中一共有 $n$ 个细胞，Markov矩阵 $M$ 为实对称矩阵，对矩阵进行对角化分解： $M=\phi\Lambda\psi,M^{t}=\phi\Lambda^{t}\psi$ 其中， $\phi,\psi$ 互逆， $\psi$ 矩阵为 $n\times n$ 的特征向量方阵， $t$ 表示多重转移次数，转移多次后可以达到平稳状态，这个对角矩阵的主对角线表示的是 $M$ 矩阵的特征值（这里以3个为例）：
fig4
此时重构数据点： $new=\Lambda\psi=[\lambda_{1}\psi_{1},...,\lambda_{n}\psi_{n}]^{T}$ 其中， $\psi_{1},...,\psi_{n}$ 是 $\psi$ 矩阵的行向量；