Rand指数为Milligan和Cooper[]提出的一种评价聚类结果的指标,用来衡量聚类结果与数据的外部标准类之间的一致程度。给定一组个体的集合X={xi, i=1, …, n},假定S={s1, s2, …, sk}与R={r1, r2, …, rk}为2种不同划分(如S为外部标准类,R为聚类结果)。若a为S与R中都属于同一类的个体对数,b为S中属于同一类而R中不属于同一类的个体对数,c为R中属于同一类而S中不属于同一类的个体丢书,d为两种划分下都不属于同一类的个体对数,则a和d反映这2种划分的一致性,而b和c则反映不一致性,Rand指数定义为(a+d)/(a+b+c+d)。Rand指数值位于0和1之间,Rand指数值越大,表明2种划分的一致程度越高,当2种划分完全一致时,Rand指数值取1。