一、 聚类的趋势
使用霍普金斯统计量(Hopkins Statistics)来量化评估。
① 从所有的样本向量中随机找n个向量,把它们称为p向量,每一个向量分别是p1、p2、……、pn。对每一个向量都在样本空间里找一个离其最近的向量,然后求距离(用欧氏距离即可),然后用x1、x2、……、xn来表示这个距离。
② 在所有样本向量中随机找n个向量,把它们称为q向量,每一个向量分别是q1、q2、……、qn。对每一个向量都在样本空间里找一个离其最近的向量,然后求距离(用欧氏距离即可),然后用y1、y2、……、yn来表示这个距离。
③ 求出霍普金斯统计量H:
H = ∑ i = 1 n y i ∑ i = 1 n x i + ∑ i = 1 n y i H=\frac{\sum^{n}_{i=1}{y_i}}{
{\sum^{n}_{i=1}{x_i}}+ {\sum^{n}_{i=1}{y_i}}} H=