半监督学习算法
第一种:无标签数据预训练,有标签数据微调
预先用所有数据逐层重构预训练,对网络的每一层进行重构自编码,得到参数后用有标签数据 微调(有标签数据是验证集来进行调整 )
重构自编码
自编码:是一种无监督学习模型,它令每个样本的数据是它本身,自编码相当于自己生成标签,而且标签是样本本身。
自编码器能从数据样本中进行无监督学习,这意味着可将这个算法应用到某个数据集中,来取得良好的性能,且不需要任何新的特征工程,只需要适当地训练数据。
第二种:利用从网络中得到的深度特征来做半监督算法
先用有标签数据训练得到一个网络模型,在让无标签数据送入网络中,以分类概率类别最高的作为数据的标签,然后再将无标签数据和有标签数据一起再网络模型中训练,如此循环,从而得到一个较好的模型。
但是再实际应用中,这种效果往往比较差,因为极易出现错误的标签,因为再前面训练中只有一部分有标签数据,所以容易产生过拟合问题,对无标签数据进行生成标签的时候,肯定会参杂着很多错误的标签,