半监督学习为什么能work?以及直推式学习是什么

今天在看半监督的时候,突然想起这个问题:

半监督用训好的模型去生成伪标签,再把伪标签当做真标签去训,但是模型能生成伪标签说明模型已经学到了这部分内容,把模型已经学会的内容加进去,让模型继续学,能学出什么新东西呢?

去知乎搜了一下,一张图简洁明了地解决了我的疑问,太有力了,所以记录一下。
在这里插入图片描述
比如这张图展示的分布,如果我们一开始只有红蓝两个点是labelled,那么我们直接分,只能分出右边的情况。

但是使用半监督,我们不断地用已有的数据,给新的未标签的数据打标签,就可以变成左边这种分类器。

所以,半监督的意义是,在给未标注的数据打标签的过程中,我们实际上还是引入了新的信息:真实的数据分布。

如果某个场景里用半监督不能引入这个信息,那么在那个场景里半监督是无效的。


顺便记录一下查询过程中了解的直推式学习。

直推式学习不同于一般的归纳式学习,它是可以看到测试集的。

核心思想就是,我们常用的归纳型学习是通过在训练集上优化并学习,但是我们的最终目标是在数据集上做得好,并不是很在乎训练集上能有多少准确度。所以,可以把测试集的情况也拿进来看到,在这种前提下,去预测测试集的结果。(有点像半监督学习的作用对吧)

但是他的缺点在于,不同于归纳式学习学好了之后,如果有新的数据,直接塞进模型预测就好。直推式学习每引进一个新的测试数据,都要重新训练。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值