半监督学习任务主要分为半监督聚类、半监督分类、半监督回归等问题,我们主要针对半监督分类问题。
半监督学习的假设
- 基于低密度假设
模型的决策边界不应该将该密度区域划分开,而应该处在低密度区域内。 - 基于平滑化假设
输入空间中,距离相近的两个样本应该有相同的标签。
平滑化与低密度假设 - 基于流形假设
data points on the same low-dimensional manifold should have the same label.
流形假设是指具有相似性质的示例,其通常处于较小的局部领域,因此标记也十分相似,这种假设反映了决策函数的局部平滑性。
流形假设 - 基于聚类假设
位于同一个簇中的样本往往具有相似的标签,而处于不同簇中的样本其标签往往不同。
主要研究的方法(self-labeled)
self-labeled方法的分类:
self-labeled的分类图
self-teaching与multi-teaching的比较:
self-teaching即自己教的知识再用来提升自己,由于自己先前的认知有错误,很可能会恶化模型。
multi-teaching即两个不同的