1、多视图聚类
从对事物的不同角度的理解生成多个特征描述视图,而非单个视图,就是多视图。
若对事物作单视图特征表示,则意味着,增加了特征空间的维度,且不同角度的特征合成同一视图,其特征可能失去原有的意义。
而多视图,则能够发挥各个视图的优势,把同一数据表示成多个特征集,然后在每个特征集上可以用不同的方法进行学习,达到协同学习的目的,改善学习性能。
半监督多视图学习:
找到将将标记数据较好分类的视图,然后将该视图训练出的分类器对未标记的数据进行分类,并将分类结果给到其他视图,帮助其他视图训练分类器。
2、子空间聚类
-
为什么
1)高维数据使可视化和理解输入变得困难,通常需要预先应用降维技术。它导致了“维度诅咒”,即随着维度增加,所有子空间的完整枚举变得难以处理;
2)大多数底层聚类技术依赖于结果和降维技术的选择;
3)数据的许多维度彼此之间可能是不相关的,并且可以在有噪声的数据中屏蔽现有的聚类;
4)一种常见的技术是执行特征选择,但是在某些情况下,识别冗余维度是不容易的。 -
是什么
子空间聚类是一种在不同子空间发现聚类的技术。
基本的假设是,我们可以找到只由维度子集定义的有效聚类。
子空间聚类算法拓展了特征选择的任务,尝试对相同数据的不同子空间上发现聚类;比如对于n个三维的数据,维度分别为abc,当在三维空间中无法区分数据时,可以找到其子空间,假如是ac将其分开,则能够在此子空间下容易地识别类。