分类
直推学习:训练过程中使用待测试数据,目的是提高对这些数据分类的正确率。
归纳学习:训练过程的目的是提出一个能够泛用的模型,而不是单单为了某些待测试数据。
常用方法
self-training
自我训练:方法非常直观
①根据有标签的data训练出一个模型;
②把无标签的data代入模型,得到可能性最大的标签
③选择②中一些表现比较好的数据(指得到的最大可能性与其他可能性差距较大,即这个label大概率是对的),重新带入①中,继续训练
④重复直至收敛
Entropy-based Regularization
如上图,介绍一种称为Entropy-based Regularization的方法。
首先,Entropy是用于衡量生成标签的可能性的分散程度,如果可能性十分集中,这个值E就会越小,而我们希望他是更集中的。
所以在设计Loss函数的时候,我们在一般的item后面加了一项
用于描述我们期