最近看了下Label propagation算法,说实话直接看朱晓进的原著论文感觉还是蛮复杂的(公式有点多而且我的英语真心不咋的),后来偷懒网上找了下中文的相关论文和博客才算稍微弄懂了点。
首先,LP算法是一个基于图的半监督学习的算法。类似于监督学习算法中的KNN算法,假设越相近的点更有可能具有相同的类别标签,然后根据少量的有标签的样本,根据一些规则判断相邻节点之间的相似性,根据相似性对为未标签的样本进行标记。算法的描述如下:
输入:u个未标注数据,l个标注数据及类别C
输出:u个未标注数据的标注
1.初始化,利用公式