机器学习常识 14: 半监督学习

最新推荐文章于 2024-07-09 12:07:29 发布

闵帆

最新推荐文章于 2024-07-09 12:07:29 发布

阅读量971

点赞数 3

分类专栏：机器学习常识文章标签：机器学习学习人工智能

本文链接：https://blog.csdn.net/minfanphd/article/details/130989142

版权

25 篇文章 38 订阅

订阅专栏

半监督学习结合了监督与无监督学习，利用少量标签数据和大量无标签数据来提升模型预测能力。文章通过不同的学习场景，如主治医生指导实习生诊断流感的例子，阐述了半监督学习在不同情况下的应用，包括封闭世界和开放世界二分类问题。这种学习方式对于处理大量未标记数据的问题尤为有效。

摘要由CSDN通过智能技术生成

摘要: 半监督学习强调的是一种学习场景, 在该场景下, 无标签数据可以协助带标签数据提升预测质量.

1. 基本概念

从三者的关系可以看出, 半监督学习是从监督学习与无监督学习自然推导出来的.

半监督学习的一大意义在于, 它导出了学习场景这个概念.

上午来了 100 个就诊者, 主治医生啥也没说, 实习生自悟, 把他们分成几个簇, 并且无法解释每簇的语义 (是否患病之类), 这是无监督学习场景中的聚类问题.
上午来了 100 个就诊者, 主治医生对每个人判断, 哪些患流感 (正例), 哪些没有 (负例). 实习生学习到流感的诊断方法. 下午来了新的就诊者, 实习生对他们进行诊断. 这是监督学习场景中的二分类问题.
上午来了 100 个就诊者, 主治医生对其中的 40 个人判断, 哪些患流感 (正例), 哪些没有 (负例). 实习生对剩下的 60 人进行诊断. 这是封闭世界半监督学习场景中的二分类问题.
上午来了 100 个就诊者, 主治医生对其中的 40 个人判断, 哪些患流感 (正例), 哪些没有 (负例). 下午来了新的就诊者, 实习生对他们进行诊断. 这是开放世界半监督学习场景中的二分类问题.

关于半监督学习中无标签数据协助提升学习器质量的讨论, 参见半监督学习之白话版 (图示).
关于场景的其它论述, 参见机器学习研究套路: 数据、场景、问题、方法.