最近在读聚类文章中欧式空间和非欧式空间的概念时,对此多有些疑惑,下面对此概念写出目前的一些理解
表示n个样本,每个样本具有m个特征度量,那么矩阵X依据行和列就组成了一个超空间。它比二维、三维的维度更广。
根据现在的理解,基于矩阵分解的聚类在原始数据维度X进行的度量,例如角度、距离等由二维、三维空间拓展过去的概念操作时,可以认为是在欧式空间进行的度量
如果我们跳出这个超空间,做一个相似矩阵的构造,例如依据某种相似性度量方法对每个样本之间进行度量,得到以样本为顶点的图,其中V为顶点(代表样本),E为顶点之间的权重。那么依据数据结构知识,G依旧可以写成一个邻接矩阵形式
,那么G也就构成了一个n维空间的超空间。
目前的理解来看,非欧空间就是指脱离原始数据空间的一个度量,一个例子就是对原始数据构建相似矩阵(affinity matrix)来进行度量的情况。