2017-ICCV-SVDNet for Pedestrian Retrieval 论文笔记

最新推荐文章于 2022-05-18 19:21:30 发布

rxdffz

最新推荐文章于 2022-05-18 19:21:30 发布

阅读量427

点赞数

本文链接：https://blog.csdn.net/wxf19940618/article/details/84988482

版权

SVDNet是为了解决卷积神经网络中权重向量相关性导致的表示问题，通过引入SVD分解和正交化约束提升行人再识别性能。论文提出了一种三步训练策略，包括去相关、约束和松弛迭代，以近似权重矩阵的正交性，从而提高模型的辨别能力。

摘要由CSDN通过智能技术生成

SVDNet for Pedestrian Retrieval 论文笔记

一、提出问题

卷积神经网络在进行分类时全连接层的权重向量是高度相关的，如图1-1，训练数据中的粉色和红色两个高度相关的向量会影响对测试数据的表示（粉色和红色造成了冗余），这可能最终导致粉色和红色向量投影主导欧几里德距离，并导致较差的结果。

图1-1 相关向量表示及其负面影响

造成这个问题的两个原因分别是：

二、论文贡献

提出了SVDNet，其特征在于包含去相关权重向量的FC层；
提出一种新颖的三步训练方案。在第一步中，权重矩阵经历奇异向量分解（SVD）并且被左酉矩阵和奇异值矩阵的乘积代替。其次，保持正交化权重矩阵固定，并仅对剩余层进行微调。第三，权重矩阵是不固定的，并且网络被训练用于整体优化。迭代这三个步骤以近似权重矩阵的正交性。

三、论文方法

图3-1 模型结构

3. 1 模型结构

将Eigenlayer定位在倒数第二个FC层而不是最后一个FC层的原因是：当在最后一个FC层上强制执行正交性时，模型将无法收敛，这可能是由于最后一个FC层中权重向量的相关性由训练样本分布决定。

在测试时，可以用Eigenlayer的输入特征或者输出的特征作为测试的特征表示，两者结果相差不大，之所以Eigenlayer的输入特征也有正交特性是由于训练时的BP反向传播导致的。

3. 2 训练策略

关注