相比传统聚类算法,Affinity Propagation Clustering(AP算法)的优势在于:1)、对初值不敏感(严格说AP中需要人工设定的初值包括preference和为了减少震荡引入的参数lamda,其中前者的大小决定了最终的类别数多少,后者决定了收敛速度。)2、聚类性能和效率大幅度提升。然后AP属于single-exemplar based 方法,即一个cluster中只有一个exemplar,这对于存在多个subclass的情况,就会存在问题。Multi-exemplar affinity propagation(MAP) 则解决了上述由于single exemplar引起的问题。MAP认为一个cluster中存在一个super exempar和多个exemplars,如下图所示:
上图可见,两组图片描述的都是coast scence,但是一组有sunset/sunrise,另一组没有,如果使用AP算法,这两组图片就会被分成两个cluster,虽然实际上他们应该是同类的,即应该属于一个super cluster。
(有事暂离,回来再续)