1)pdist 计算两两对象间的欧氏距离
Y=pdist(X)
计算 m × n 矩阵X(看作 m 个 n 维行向量)中两两对象间的欧氏距离。对于有 m 个对象组成的数据集,共有(m-1)⋅ m/2
个两两对象组合。
输出Y是包含距离信息的长度为 (m-1)⋅ m/2
的向量。可用squareform
函数将此向量转换为方阵,这样可使矩阵中的元素(i,j)对应原始数据集中对象i和j间的距离。
Y=pdist(X,’metric’)
中用’metric’指定的方法计算矩阵X中对象间的距离。’metric’可取表1中特征字符串值。
表 1’metric’取值及含义
字符串 | 含 义 |
---|---|
’Euclid’ | 欧氏距离(缺省) |
’SEuclid’ | 标准欧氏距离 |
’Mahal’ | 马氏距离(Mahalanobis距离) |
’CityBlock’ | 绝对值距离 |
’Minkowski’ | 闵氏距离(Minkowski距离) |
Y=pdist(X,’minkowski’,p)
用闵氏距离计算矩阵X中对象间的距离。p为闵氏距离计算用到的指数值,缺省为2。
2)linkage 使用最短距离算法生成具层次结构的聚类树
Z=linkage(Y)
使用最短距离算法生成具层次结构的聚