要想提高学习类的算法,最简单的方法就是使用更多的数据,但是有标签的数据往往是很难获取的,因此对于无标签的数据的学习,我们有自学习算法和无监督特学习算法。
有两类常用的特征学习算法,自学习算法的前提假设是无标签的数据和有标签的数据不一定满足一样的分布,而无监督学习算法的前提假设是两者的分布是一样的。
我们先来介绍一下特征学习:
我们之前讲过自编码器,输入时有标签的数据集
对于训练好的参数: ,给定任意输入,我们可以得到隐层的a。
我们去掉稀疏自编码器的最后一层,就得到如下模型
对于每一个输入值,我们可以得到对应的激活函数,即如下:
我们的输入可以替换为