无监督学习(unsurpervised learning)是深度学习的基础,也是大数据时代科学家们用来处理数据挖掘的主要工具。个人理解的话就是数据太多,而人们不可能给每个数据样本加标签吧,所以才有了无监督学习。
当然用的最多的是用无监督学习算法训练参数,然后用一部分加了标签的数据测试,这种方法叫半监督学习(semi-unsurpervised)。
最近看的几个深度学习算法是:
稀疏自编码(sparse auto-encoder)
稀疏限制玻尔兹曼机器(sparse RBM)
K-means 聚类和高斯混合模型
根据论文An Analysis of Single-Layer Networks in Unsupervised Feature Learning的实验结果,K-means聚类算法是准确率最高,而且不需要超参数(hyper-parameter)。