Learning with Local and Global Consistency

最新推荐文章于 2023-06-10 20:28:22 发布

wendox

最新推荐文章于 2023-06-10 20:28:22 发布

阅读量4.2k

点赞数

分类专栏： ML

本文链接：https://blog.csdn.net/wendox/article/details/50492131

版权

这篇博客探讨了半监督学习中的一致性假设，包括局部和全局一致性，并介绍了一个迭代算法，通过让每个数据点传播其标签信息来实现全局稳定。算法的关键在于构建一个平滑的分类函数，通过邻接点间的信息交换逐步预测未标注数据的标签。正则化框架提供了对算法的损失函数和收敛性的理解。

摘要由CSDN通过智能技术生成

简介

半监督学习问题（直推推断）的主要方法设计一个相对于intrinsic structure平滑的分类函数，本证结构由已标注和未标注的数据揭露。
给定一组数据 $\mathcal{X}=\{x_1,...,x_l,x_{l+1},...,x_n\}$ 以及一个标签集合 $\mathcal{L}=\{1,2,...,c\}$ ，前l个数据已有标签，剩下的没有，算法的性能由这些未标注的数据的错误率测量。
半监督学习的的关键是一致性先验假设（prior assumption of consistency）。这意味着

靠近的数据点可能有相同的标签。
有相同结构的的数据点可能有相同的标签。
这个论点很类似与聚类假设。前一个假设是局部的，后一个全局的。经典的监督学习方法大部分只是应用了第一种假设。

The main differences between the various semi-supervised learning algorithms, such as spectral methods, random walks, graph mincuts and transductive SVM, lie in their way of realizing the assumption of consistency.

一个简单的迭代算法可以构造一个平滑的函数。文中方法的关键是让每个点iteratively spread 他的标签信息到他的临近，直到实现全局稳定。

算法

Given a point set $\mathcal{X} = \{x_1,..., x_l, x_l+1,..., x_n\} \subset \mathbf{R}^m$ and a label set $\mathcal{L} =\{1,...,c\}$ the first l points $x_i(i\leq l)$ are labeled as yi∈L