聚类算法中两种有代表性的数据结构
(1)数据矩阵:用p个变量表示n个对象,每一行代表一个对象的p个属性值,相当于一条记录。
(2)相异度矩阵 dissimilarity matrix:存放n个对象两两之间的相异度的n*n个矩阵
其中d(i,j)表示对象i和对象j之间的相异度的数值,越相似越接近于0;反之,其值越大。显然为下三角矩阵,d(i,j) =d(j,i)
聚类算法中两种有代表性的数据结构
(1)数据矩阵:用p个变量表示n个对象,每一行代表一个对象的p个属性值,相当于一条记录。
(2)相异度矩阵 dissimilarity matrix:存放n个对象两两之间的相异度的n*n个矩阵
其中d(i,j)表示对象i和对象j之间的相异度的数值,越相似越接近于0;反之,其值越大。显然为下三角矩阵,d(i,j) =d(j,i)