纯半监督学习:
是一种归纳学习,它利用一部分有标记的样本和大量的未标记样本来进行训练。在训练过程中,纯半监督学习尝试从未标记样本中提取有用的信息,以改善对标记样本的学习效果。这种学习方法可以对测试样本进行预测,因为它基于“开放世界”的假设,即认为训练时并不知道最终的测试用例是什么。纯半监督学习的目标是取得好的泛化能力,能够对训练过程中未观察到的数据进行预测。
直推学习:
是一种transductive学习,它只利用有标记的样本和一部分未标记的样本来进行训练,并尝试在训练过程中直接对未标记样本进行标记。直推学习的目标是在特定的无标签样本上获得最佳的预测性能,而不是使模型在未标记样本上取得最佳的泛化能力。它假设未标记的数据就是最终要用来测试的数据。因此,直推学习并不关注模型在新数据上的泛化能力,这与纯半监督学习的目标形成了对比。
总结
- 纯半监督学习和直推学习的主要区别在于它们的学习目标和泛化能力范围。
- 纯半监督学习注重提高模型在整个数据空间中的泛化性能,适用于更广泛的应用场景。
- 直推学习则专注于特定未标记样本的预测性能优化,适用于具有明确目标数据集的情况。
在实际应用中,如果需要模型在更广泛的数据上具有好的性能表现,可以选择纯半监督学习;如果只需要模型在特定数据集上取得好的预测效果,可以选择直推学习。