![7d3d0a12344c11bd8097995effb99ec9.png](https://img-blog.csdnimg.cn/img_convert/7d3d0a12344c11bd8097995effb99ec9.png)
本文要解决的问题是人脸聚类,这类任务的目的是将一批无标记的人脸通过聚类使得自同一个人的人脸聚在一起。作者将这个问题转换为链路预测的问题,当两个人脸属于同一个人时,那么他们之间存在一条边。作者发现特征空间中某个人脸的上下文,即局部信息是非常重要的,因此提出通过GCN来学习,通过GCN来预测两个人脸之间是否存在连接的可能性。
引言
人脸聚类在人脸分析中是一类基础任务,它的应用场景包括相册整理,大规模的图像或者视频的快速检索,自动数据标注或者清洗等。
传统的方法通常对数据的分布有严苛的假设,通常受限于人脸表征的复杂分布。比如,K-Means需要类簇是凸的,谱聚类需要不同类簇的样本数是均衡的,DBSCAN假设所有类簇的密度是同密度的。而基于链接关系的聚类通常对数据分布没有要求,这类方法有4类方法,如下图所示。图(a)表示将人脸聚类的问题转换为联系预测问题,图(b)代表的是一类很直观地方法,直接基于特征空间中实例之间的 距离设定某个阈值,这类方法显然不是一种合适的方式,因为类簇的差异非常大,因此更复杂的度量提出来计算联系的似然概率,图(c)是这类方法的一个代表AROD(Approximate Rank-Order Distance),这是类启发式的计算方法。
本文不同于上述方法,提出通过学习来预测两个节点是否应该有联系。提出这个方法的一个动机是作者发现一个节点和其周围节点是否有关