论文链接
总结
CC:将得到的特征向量分别放入到实例层和聚类层中同时进行优化。
对比训练
对比训练的思想就是将原始数据映射到一个新的向量空间,在这个向量空间中,正样本对之间的相似性和负样本之间差异被最大化。
网络
网络分为三个部分:a pair construction backbone (PCB), an instance-level contrastive head (ICH),and a cluster-level contrastive head (CCH)。
1. PCB
选定一个转换方法集合 T T T(文中选择的是ResizedCrop,ColorJitter, Grayscale, HorizontalFlip, and GaussianBlur),对输入的图片x,从 T T T中随机抽取两种转换方法 T a 、 T b T^a、T^b Ta、Tb,分别对x进行转换,得到增广后的图片 x a 、 x b x^a、x^b xa、xb。接着构造一个神经网络(常规的卷积网络如resnet等),分别以 x a 、 x b x^a、x^b xa、xb作为输入,得到它们的特征向量(1*F的向量)。按照这个方法对所有输入的图片进行处理,将使用 T a T^a Ta方法进行增广的图片对应的特征向量拼接在一起,就得到了特征矩阵 h a h^a ha,同理可以得到 h b h^b hb。
2. ICH
首先,要定义对比训练中的正负样本对是什么。评价的标准可以不同,在论文中是让由同一个图像x增广出的图像 x a 、 x b x^a、x^b xa、xb为正样本对,而与除此之外的所有图像互为负样本对。
然后,在得到上述的特征矩阵