这个层次聚类算法AGNES就很简单了, 看书就能看明白,估计没人搜索吧,哈哈。
最主要的是定义两个簇之间的距离:
1.可以是两个簇之间 的最大距离: 两个簇 的 两个样本之间的距离最远 时的距离
2.可以是两个簇之间 的最小距离:两个簇 的 两个样本之间的距离最短时的距离
3.可以是两个簇之间 的平均距离:两个簇所有样本间距离的均值
取层次聚类 - 自底向上聚类策略 的 算法描述:
1. 把所有的样本各自都当成一个 簇, 并定义一个距离矩阵,这个矩阵是每个样本的簇到其余簇之间的距离。
2. 搜索距离 矩阵,找到最小的 两个簇,把他们合并后,其簇名取较小的簇名(eg:C1 + C3 ->C1),
然后把所有簇的名字都往前移动一位,(因为C3没有啦,所以C4改名叫C3,C5改名叫C4,这样在算距离矩阵的时候方便),
由于簇合并了,所以距离矩阵需要修正, 重新计算新的簇到其他所有簇间的距离。(eg:C1到C2的距离,C1到C3的距离、、)
3.一步步迭代步骤2,知道达到我们规定的聚类个数时,聚类结束。
OK,
88~