聚类的基础就是算出所有元素两两间的距离,我们首先做一些示例数据,如下:
x=runif(10)
y=runif(10)
S=cbind(x,y) #得到2维的数组
rownames(S)=paste("Name",1:10,"") #赋予名称,便于识别分类
out.dist=dist(S,method="euclidean") #数值变距离
这个代码运行得到的S是一个矩阵,如下
> S
x y
Name 1 0.41517985 0.4697017
Name 2 0.35653781 0.1132367
Name 3 0.52253349 0.3680286
Name 4 0.80558684 0.9834687
Name 5 0.04564145 0.8560690
Name 6 0.11044397 0.2988598
Name 7 0.34984447 0.8515141
Name 8 0.28097709 0.1260050
Name 9 0.81771888 0.5976135
Name 10 0.40700158 0.5236567
可以看出里面共有10个点,它们的X,Y坐标均已知,我们有6总方法可以求矩阵
注释:在聚类中求两点的距离有:
1&