【台大李宏毅ML课程】Lecture 12 Semi-Supervised Learning半监督学习笔记

本节课主要讲了半监督学习Semi-supervised:样本中有一部分数据有标签(label data)但很少,另一部分数据无标签(unlabel data),很多~因为收集无标签的数据很容易,但是收集有标签数据没那么容易~

图片来源于李宏毅老师ppt,如有错误务必指正!!
博主总结的时候喜欢中英夹杂,别介意!

1.Semi-supervised Generative Model
基本思想(EM):
(1)先用label data训练一个model
(2)再用unlabel data不断更新model
这里写图片描述
与一般的生成模型不同的是(比如NB可以一次性就得到closed form solution),这种方式需要不断iterate~这种方式也叫作self-training

self-training
基本思想:
(1)先用label data 训练一个model f
(2)用这个model f去test unlabel data,会得到pseu-label的数据(假装被分了类),再把这些数据加入label data集

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值