DPSOM笔记

最新推荐文章于 2024-04-24 13:30:10 发布

LzQuarter

最新推荐文章于 2024-04-24 13:30:10 发布

阅读量221

点赞数

文章标签：深度学习机器学习人工智能

本文链接：https://blog.csdn.net/qq_34193444/article/details/109386587

版权

由于本人项目任务不涉及时序序列分析，故时序序列分析部分的原理和实验并没看，并且由于本人基础薄弱，不能保证对文章的理解清晰到位，仅供参考

摘要

相关任务目标：对复杂数据进行可解释的可视化
两大主要技术路线：聚类 & 表示学习
现状：两种技术路线并没有成功地结合使用过
- 比如说依赖于中间表示的拓扑结构的表示学习方法（如SOM），其表征（也即数据所匹配到的神经元在低维空间中的位置表示）的聚类效果相较深度聚类方法来得要差（因为SOM并没有对原始数据做变换，只是将神经元嵌入到数据所在空间中，因此最终表征的聚类效果与原始数据在空间中的分布相关。而深度聚类方法则是利用网络将表示空间做了变换，并基于某些聚类目标来调优该变换过程）
本文主要工作：改善了通过SOM得到的表征聚类效果不佳的现状
- 提出了一种通过概率聚类分配（PSOM）拟合SOM的新方法
- 利用VAE提出了深度概率聚类的框架
- 其他
结果：从SOM网络导出的聚类结果相比其他工作更好，且保留了SOM较好的可视化效果，其他略

传统聚类方法自然直观，但是面对高维的、复杂的、在表示空间上聚类属性弱的数据表现不佳。早先会采用如PCA的降维方法将数据投到更方便聚类的空间中。最近也有采用网络（AEs，VAEs，GANs）来完成空间映射的工作。上述模型方法产生的低维表示已经被证明能简化聚类过程。聚类方法非常成功但是并没有研究类间的关系，且用于聚类的特征点仍位于难以可视化或者解释的高维空间中
相反的，自组织图（SOM）所提供的表征是高度可解释的，它在原始数据簇上引入灵活的邻域结构，从而刻画出数据簇之间的拓扑关系。但其性能很大程度上取决于原始数据的复杂性。在高维复杂数据上表现不佳，生成的低维表征聚类性质差
为解决SOM中存在的问题，我们提出了PSOM（一种训练SOM的方法）、DPSOM（一种将VAE和PSOM结合的方法）~~，在这里我们将映射后的数据点处理成概率分布，并最小化这个分布与SOM节点分布的KL散度，从而即调整了SOM也使得数据的映射更加便于用SOM拟合~~

SOM定义一个包含了K个节点的拓扑结构，每个节点对应于特征空间中的一个中心，在训练时，每次选择一个随机样本，令与之最近的SOM节点及其邻域节点更加靠近该样本
集群分配强化技术（CAH），在深度聚类的实践中有效地增强了中间表示的性质，具体内容有如下
- 利用学生T分布以及同一个样本 $i$ 和其他所有中心 $j$ 之间的距离生成距离度量 $s_{ij}$ ， $s_{ij}$ 表示样本 $i$ 属于簇 $j$ 的相似度，利用任一时刻下 $f(x_i)$ （原始数据映射后的表示）与 $\mu_j$ （特征空间中的SOM节点）都可以求出所有的 $s_{ij}$ ，并将所有的 $s_{ij}$ 记为 $S$
- 构造了另一个分布 $T$ ，该分布是基于 $S$ 分布变换得到的，主要变化是会使得概率高的位置的概率更高，并利用KL散度使得分布 $S$ 与分布 $T$ 靠近
- 该构造的物理意义是迫使表征空间中的数据点与中心的关系更“纯”（样本与其所属的类中心更近，与其他类中心更远）

PSOM包含了两项，CAH损失项（前面介绍过），以及Soft SOM损失，Soft SOM的损失可以被直观的解释为 $s_{ij}$ 以及 $s_{in_{z}(j)}$ 之间的交叉熵的和（对不同 $z$ 做和），其中 $n_z(j)$ 表示距离样本 $i$ 第 $z$ 近的聚类中心的下标，更直观的说就是，当表征空间中的数据与某中心靠近时，该数据也要与邻域内的中心靠近
PSOM等于CAH损失和S-SOM损失按权重相加，乘在S-SOM上的权重 $β$ 决定了最终的表征偏向聚类性能还是簇间结构关系

VAE部分请看其他论文，主要特点是在生成中间表示是生成两部分，一部分是特征的均值，一部分是特征的标准差，然后利用采样获得实际的中间表征。该中间表征就是用于PSOM部分的表征。而VAE损失包含两部分，一部分编码重构损失，一部分结构损失，结构损失指的是中间表示的分布应尽量靠近一个高斯分布，将VAE损失与前面提到的CAH损失和S-SOM损失联立起来即得到DPSOM的最终损失项

略

关注