论文三篇文章

綺魍

于 2020-05-12 17:19:12 发布

阅读量210

点赞数

分类专栏：杂七杂八

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_35307564/article/details/106080112

版权

杂七杂八专栏收录该内容

1 篇文章 0 订阅

订阅专栏

多通道CNN 基于部分卷积神经网络模型，并且结合改善的三元组损失函数

本文的所提出的 CNN model 和改进的三元组损失函数可以认为是学习一个映射函数，使得能够将原始 raw image 映射成一个特征空间，该特征空间使得同一个人的图像距离小于不同行人的图像距离。所以，所提出的框架，可以学习到最优的特征和距离度量，从而更好的进行行人的在识别任务。

五个层；

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

总结：

总体来说，感觉还是比较暴力的解决方案。一方面来说，文章提出了一种利用 human part 和 global body 进行精细化识别的框架来提供更加有效的 feature。另一方面，改善了三元组损失函数，使得最终的训练更加有效。这是本文中，两个最重要的创新点。

A Discriminatively Learned CNN Embedding for Person Re-identification

主要的特点是采用双loss组合（Identification loss and verification loss）去增强特征的表达（提高类内特征的聚拢性和类间特征的区分性）。

扩大类间距离，缩小类内距离；

这里面的verification loss可以借鉴metric learning中的方法，如contrastive loss、triplet loss等等一系列。其实结合meric learning和cnn的方案最早是出现在人脸识别领域中（如王晓刚老师组的deep ID 系列和google的triplet等）。

Top-push Video-based Person Re-identification

文中针对图片序列（视频）提取 HOG3D 等特征，并提出 TDL(Top-push Distance Learning) 的距离度量学习方法。
TDL 跟近年来的很多方法（如 KISSME[2] ）一样，也是基于马氏距离(Mahalanobis distance)进行学习。

在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
论文三篇文章

多通道CNN 基于部分卷积神经网络模型，并且结合改善的三元组损失函数本文的所提出的 CNN model 和改进的三元组损失函数可以认为是学习一个映射函数，使得能够将原始 raw image 映射成一个特征空间，该特征空间使得同一个人的图像距离小于不同行人的图像距离。所以，所提出的框架，可以学习到最优的特征和距离度量，从而更好的进行行人的在识别任务。五个层；![在这里插入图片描述](https://img-blog.csdnimg.cn/20200512165935646.png?x-os
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。