谱聚类适合Few clusters, even cluster size, non-flat geometry,所以如果batch中的类别很多的话,这个套路是不是就不一定work了呢…
用ResNet提取特征,然后再对batch内所有image依据visual similarity建图(商汤的图和图森的这篇有点区别),然后从graph cut的角度出发,对某个person,希望找到一种cut能将与这个person相同的样本分到一起,不同的分到不同的group;接下来用谱聚类的思路解这个graph cut问题,对特征进行变换,使其包含group信息,然后将这样的特征继续用于CNN pipeline做分类。
和自注意机制有点像