【self-taught learning】快速稀疏编码算法
Self-taught learning是Honglak Lee等开发的一个matlab框架,能够实现他们在论文Self-taught Learning Transfer Learningfrom Unlabeled Data和Efficient sparse coding algorithms中提出的快速实现图像稀疏编码的算法。
先看第一篇论文《Self-taught Learning:Transfer Learning from Unlabeled Data》
主要思想:
在监督分类算法的数据中,加入部分unlabel的数据,未标数据不一定和训练集数据从属同一类类别,在建模过程中,首先根据未标数据训练出一组基,然后对训练集的数据用该空间的基表示,最后使用SVM或其他分类算法进行分类。
PS.
这种方法不同于semi-supervised learning,后者需要加入的未标数据,必须跟训练集具有相同类型的类别,例如想要对大象和犀牛的图像集分类,就必须加入大象和犀牛的未标图像,而self-taught learning可以加入任意图像比如自然景色等。
加入未标数据是为了使图像的特征变得稀疏,能够加速训练的计算速度。