前言
本博文主要对论文中提到的图构造方法进行梳理,论文自己提出的模型并未介绍,感兴趣的可以阅读原文
摘要
基于图的半监督学习GSSL主要包含两个过程:图的构建和标签推测。传统的GSSL中这两个过程是完全独立的,一旦图结构构建完成,标签推断的结果也不再改变。因此,图的结构直接影响GSSL的效果。传统的图构造方法对数据的分布做了一个具体的假设,导致图的质量严重依赖于这些假设的正确性。因此,对于传统图构造方法很难应用再复杂多样的数据分布上。本文提出了一个框架叫做通过动态地提升图质量的图半监督学习。在本方法中,图的构建是基于多个聚类结果的加权融合,并且把标签推断也整合进一个统一的框架达到相互引导,动态提升的效果。
引言
GSSL方法主要可以分为两个角度即标签推测和图的构建。标签推测主要关注于如何根据有标签的样本和相似样本提供的信息在图上进行标签学习。而GSSL成功的关键在于构建高质量的图而非好的标签推测算法。GSSL核心的假设是图中相似的样本应该有相同的标签。根据这个标准,如果样本的相似程度与真实标签一致,那么未标记的样本便可以被正确预测。相反,如果相似性与真实标签相反则会得到错误的结果。因此,图的质量对于GSSL方法的表现至关重要。
由于没有可用的评价方法来度量图的质量,图的质量一般是通过标签推测的准确率来间接度量的。这是一种事后的验证方法,对于图的