无监督学习的基本想法是对给定数据(矩阵数据)进行某种“压缩”,从而找到数 据的潜在结构。假定损失最小的压缩得到的结果就是最本质的结构。
•
考虑发掘数据的纵向结构,把相似的样本聚到同类,即对数据进行聚类
•
考虑发掘数据的横向结构,把高维空间的向量转换为低维空间的向量,即对数据进行降维。
•
同时考虑发掘数据的纵向与横向结构,假设数据由含有隐式结构的概率模型生成得到,从数据中学习该概率模型。
概率模型表示为条件概率分布
各种方法之间的关系: