论文三篇文章

多通道CNN 基于部分卷积神经网络模型,并且结合 改善的三元组损失函数

本文的所提出的 CNN model 和 改进的三元组损失函数 可以认为是学习一个映射函数,使得能够将原始 raw image 映射成 一个特征空间,该特征空间使得同一个人的图像距离 小于 不同行人的图像距离。所以,所提出的框架,可以学习到最优的特征和距离度量,从而更好的进行行人的在识别任务。


五个层;

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

总结:

总体来说,感觉还是比较暴力的解决方案。一方面来说,文章提出了一种利用 human part 和 global body 进行精细化识别的框架来提供更加有效的 feature。另一方面,改善了三元组损失函数,使得最终的训练更加有效。 这是本文中,两个最重要的创新点。

A Discriminatively Learned CNN Embedding for Person Re-identification

主要的特点是采用双loss组合(Identification loss and verification loss)去增强特征的表达(提高类内特征的聚拢性和类间特征的区分性)。

扩大类间距离,缩小类内距离;

这里面的verification loss可以借鉴metric learning中的方法,如contrastive loss、triplet loss等等一系列。其实结合meric learning和cnn的方案最早是出现在人脸识别领域中(如王晓刚老师组的deep ID 系列和google的triplet等)。

Top-push Video-based Person Re-identification

文中针对图片序列(视频)提取 HOG3D 等特征,并提出 TDL(Top-push Distance Learning) 的距离度量学习方法。
TDL 跟近年来的很多方法(如 KISSME[2] )一样,也是基于马氏距离(Mahalanobis distance)进行学习。

在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值