Neural Codes for image retrieval(ECCV 2014)
一、核心思想
1、主要工作利用卷积神经网络特征结合PCA数据压缩降维、实现图像检索
2、核心工作自设计了一个网络结构、并提取了三种特征编码进行检索
3、网络架构说明
conv-绿色 max-p - 红色 relu-蓝色
1、224x224x3 2、conv11-96; s = 4
3、conv5-192; s = 1 4、conv3-288; s = 1
5、conv3-288; s = 1 6、conv3-256; s = 1
7、fc 8、fc 9、fc
提取的特征编码为L5 L6 L7 分别使用 没有维度堆叠或者特征融合.
1、模型可以利用与测试数据相关性不大的数据集完成训练,并用该模型生成 测试图像的特征图像
2、模型训练好之后再利用与测试数据有相关的数据集再训练,模型的检索能力提高
4、PCA特征压缩
维度降低可以提升算法速度、减少内存消耗、并消除冗余、提升算法的效果。
个人想法:维度的选择可以动态选择、根据主成分的贡献度来抉择。
5、个人看法
网络结构可以直接设计最后的特征层获取到我们想获得的维度.
可以直接利用经典网络的预训练模型再训练相关数据提取特征.
fc层可以被全局池化层代替直接进行编码.
高层次特征数据是否应该再编码,还需考虑.