半监督之Self-Training & Co-Training

Self-training

利用已标注样本L,对未标注数据U进行标注

  1. 用所有已标注样本L进行模型训练,得到模型F
  2. 利用F对未标注数据进行预测,将置信度高的数据放入到L集合中
  3. 重复1和2,直到所有数据被标注或者无置信度高的新标注数据

 

Co-training

利用已标注样本L,对未标注数据U进行标注

  1. 数据分成2个view(比如根据2个特征维度划分),分别为L1和L2
  2. 进行模型训练,使用L1得到模型F1,使用L2得到模型F2
  3. 利用F1和F2分别对未标注数据U进行预测,把F1预测置信度高的数据放到L2,把F2预测置信度高的数据放到L1(注意这里是交叉放置)
  4. 重复2和3,直到所有数据被标注或者无置信度高的新标注数据

 

其实Self-training和Co-training除了可以进行半监督样本标注外,还可以进行进行噪声样本的学习,比如只用置信度高的部分数据进行参数更新,或者对置信度高的数据进行加权等等。

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值