前言
本文记录和学习self training相关的知识。
1.算法
上面是self-training的算法流程图,简单解释一下:
1,将初始的有标签数据集作为初始的训练集(Xtrain,ytrain)=(Xl,yl)(Xtrain,ytrain)=(Xl,yl),根据训练集训练得到一个初始分类器CintCint。
2,利用CintCint对无标签数据集XuXu中的样本进行分类,选出最有把握的样本(Xconf,yconf)(Xconf,yconf)
3,从XuXu中去掉(Xconf,yconf)(Xconf,yconf)
4,将(Xconf,yconf)(Xconf,yconf)加入到有标签数据集中,(Xtrain,ytrain)←(Xl,yl)∪(Xconf,yconf)(Xtrain,ytrain)←(Xl,yl)∪(Xconf,yconf)
5,根据新的训练集训练新的分类器,重复步骤2到5直到满足停止条件(例如所有无标签样本都被标记完了)
最后得到的分类器就是最终的分类器。
版权声明:这是CSDN博主「tyh70537」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接