摘要
首先是引出自己的论点,是否可用个体的特征来进行区分,by merely asking the feature to be discriminative of individual instances,也符合题目的个体判别:Instance Discrimination
还提到了 fine-tuning
fine-tuning 就是采用预训练的网络来重新fine-tuning
介绍
利用图片本身的语义信息来进行分类,比如论文提到的豹本身就与其他的类别有一定的不同。通过最终的学习表示与其他图像进行相似度对比。但是还有一个问题是类别数,ImageNet上有120w数据1000类,softmax计算不可行,作者提出了NCE (noise-contrastive estimation) 近似估计softmax。在学习中,将每个图像的特征存储在内存中,之后使用knn进行相似度比较。
问题: NCE方法是什么? KNN比较是什么? 在学习中如何计算分类数?
相关工作
生成模型:具有代表的是GAN网络 和variational auto-encoder
自监督模型:比如SimCRL
方法
将每一个图像都作为一个类
将 x 输入一个网络框架 f 得到128D的metric 之后输入到 Non-Parametric Softmax 中
分别解决上面的三个问题:
1、NCE方法是什么?
这个方法和softmax有很大的相似程度
2、问题二和三:
KNN就是保存k最邻近,将图像的提取特征v与内存块中的所有特征比较,用 cosine similarity 计算求得。分类数目就是全部图像,每张图像都是一个分类。