自编码机可以认为是一种无监督学习方式,它的神奇之处在于,通过自编码机,我们可以自动地从数据所有输入特征中,精炼特征。
预测模型
自编码机的精髓在于,它将同样的数据作为神经网络的两端,进行训练,使得原始数据能够经过神经网络进行编码,然后再解码,恢复到原来的模样。如下图结构所示:
输入在最中间的一层获得编码。
在大体上,损失模型和训练方法与普通神经网络类似。但是下面讲一些具体的自编码机,他们都具有这种基础结构,但是在细节上又有所不同。
不完整的自编码机(用于执行PCA)
当自编码机最中间的编码层神经元数量少于输入时,我们称其为不完整的。在这个时候,我们可以从高维输入特征中提取出低维特征。