如果这篇文章对你有一点小小的帮助,请给个关注,点个赞喔,我会非常开心的~
0. 前言
半监督学习中部分样本有标记,部分样本无标记。
半监督学习可分为两种:
- 纯半监督学习:希望学得的模型适用于未观察到的数据
- 直推学习:希望对数据集中未标记的样本进行预测
1. 半监督SVM
半监督支持向量机(Semi-Supervised Support Vector Machine)试图找到能将两类有标记样本分开,且穿过数据低密度区域的划分超平面。
TSVM(Transductive Support Vector Machine)算法流程:
- 先利用有标记样本训练一个SVM,然后对未标记的样本进行标记指派
- 寻找两个标记指派为异类且很可能错误的未标记样本,交换它们的标记
- 重新计算超平面,继续迭代第2步,寻求一个在所有样本上间隔最大化的划分超平面
min w , b , y ^ , ξ 1 2 ∣ ∣ w ∣ ∣ 2 2 + C l ∑ i = 1 l ξ i + C u ∑ i = l + 1 m ξ i s . t . y i ( w T x i + b ) ⩾ 1 − ξ i , i = 1 , . . . , l y ^ i ( w T x i + b ) ⩾ 1 − ξ i , i = l + 1 , . . . , m ξ i ⩾ 0 ,