Hierarchical Clustering with Hard-batch Triplet Loss for Person Re-identification

最新推荐文章于 2024-11-16 09:53:04 发布

原创最新推荐文章于 2024-11-16 09:53:04 发布 · 1.2k 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习 #人工智能 #神经网络

paper 专栏收录该内容

3 篇文章

订阅专栏

Hierarchical Clustering with Hard-batch Triplet Loss for Person Re-identification

Contribution ：

提出了无监督重识别方法 HCT ；
在每次聚类迭代后使用 PK sampling ，减少 hard example 的影响，减少False Positive 样本；

HCT ：

使用 euclidean 距离；
分为四个步骤：聚类 – PK 取样 – 微调 – 评估模型性能，并反复迭代直到性能不再提升；
使用 hard_batch triplet loss 损失函数；

Conclusion：

作者在 BUC 的基础上提出无监督的重识别方法 HCT，用 euclidean 距离代替 BUC 中使用的 minmum 距离，解决了 BUC 在 merge 次数过多后性能越来越差的问题；通过 PK sampling 和 hard-batch triplet loss 进行训练，解决了 BUC 难以区分 hard examples 的问题。
作者还通过初始化伪标签并且交替训练提高了伪标签的质量。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

黑糖小芋圆

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

TripletLoss、HardTripletLoss笔记

jjj的博客

03-30

2242

一、triplet loss

【论文阅读笔记】无监督行人重识别中的采样策略

ddddddggf的博客

04-11

4177

无监督行人重识别仍然具有挑战性，目前的大多数研究将重点放到了设计算法整体框架和损失函数上，但我们发现当这两个因素保持不变时，采用不同的采样策略，模型性能也不同。由此，采样策略也就成为了影响因素之一。

参与评论您还未登录，请先登录后发表或查看评论

Hierarchical Clustering with Hard-batch Triplet Loss for Person Re-identification简单的阅读理解

qq_34124009的博客

09-27

698

Hierarchical Clustering with Hard-batch Triplet Loss for Person Re-identification 摘要 } 提出了分层聚类与硬批三联点损失相结合的伪标签聚类方法，关键思想是通过层次聚类，充分利用目标数据集中样本间的相似性，通过硬批处理的三合点损失来降低硬例的影响，产生高质量的伪标签和dimprove模型性能 } 具体来说：（1）使用层次聚类生成伪标签（2）在每次迭代中使用PK采样生成新的数据集进行训练(3)在每次迭代中进行硬批三个一组丢失的训

百度框架paddlepaddle实现改进三元组损失batch hard Triplet Loss

weixin_37864449的博客

07-11

2360

import paddle.fluid as fluid def batch_hard_triplet_loss(input, y_true, margin,batch_size): """ :param input: shape:[batch,feacture] :param y_true:shape:[batch,1],y_true is label ...

利用PyTorch的三元组损失Hard Triplet Loss进行嵌入模型微调

deephub

11-16

4505

本文介绍如何使用 PyTorch 和三元组边缘损失 (Triplet Margin Loss) 微调嵌入模型，并重点阐述实现细节和代码示例。三元组损失是一种对比损失函数，通过缩小锚点与正例间的距离，同时扩大锚点与负例间的距离来优化模型。

【arXiv 2021】Cluster Contrast for Unsupervised Person Re-Identification（CCU）

Joselynzhao

10-11

1919

方法概述 1，提出 cluster contrast（聚类对比）来存储特征向量和计算对比损失。 2，展示了通过聚类级别的内存字典，可以解决聚类特征表达不一致的问题。文章目录方法概述内容概要工作概述成果概述方法详解方法框架算法描述具体实现实验结果总体评价引用格式参考文献内容概要论文名称简称会议/期刊出版年份 baseline backbone 数据集 Cluster Contrast for Unsupervised Person Re-Identification CCU a.

CCF A类会议或期刊----近两年聚类相关论文

Thincor的博客

03-21

6630

会议/期刊论文 sigmod2021 Fast Density-Peaks Clustering: Multicore-based Parallelization Approach. sigmod2021 SharPer: Sharding Permissioned Blockchains Over Network Clusters. sigmod2021 Dynamic Structural Clustering on Graphs. sigmod2021 On Saving....

CVPR 2020 论文大盘点-行人检测与重识别篇

OpenCV中文网

10-26

2240

本文盘点CVPR 2020 所有行人检测（Pedestrian Detection）与人员重识别（Person Re-Identification，ReID）相关论文，在视频监控领域该方...

【论文阅读】Dense Passage Retrieval for Open-Domain Question Answering

xxr233的博客

07-20

1973

Dense Passage Retrieval for Open-Domain Question Answering

CVPR2020 ReID（1）——相关论文汇总及解读

与贰的博客

06-16

6433

【NIPS 2020】Self-paced Contrastive Learning with Hybrid Memory for Domain Adaptive Object Re-ID

Joselynzhao

10-09

1098

#方法概述文章目录内容概要工作概述成果概述方法详解方法框架算法描述具体实现实验结果总体评价引用格式参考文献内容概要论文名称简称会议/期刊出版年份 baseline backbone 数据集 row 1 col 1 row 1 col 2 在线链接：源码链接：工作概述成果概述方法详解方法框架算法描述具体实现实验结果总体评价引用格式参考文献 ...

目标检测打卡营下：YOLOv3、PP-YOLO、CornerNet、FCOS

qq_56591814的博客

09-28

1975

介绍了YOLOv3、PP-YOLO算法及Anchor-Free算法CornerNet、FCOS，以及如何打好AI比赛

深度学习triplet loss 做人再识别（person-reid）

谷雨的博客

02-21

1万+

最近需要做这个课题，采用深度学习做，废话不多说，直接说一下我的思路以及遇到的问题，希望能有人交流一下（哭，效果一直不好，找不到原因）。主要是参照cvpr的这篇论文Person Re-Identification by Multi-Channel Parts-Based CNN with Improved Triplet Loss Function.pdf（链接http://z-yt.net/tmp/

基于深度学习的Person Re-ID（综述）

最新发布

07-12

在对象导航（Object Navigation）任务中，构建**分层对象到区域图**（Hierarchical Object-to-Zone Graph）是一种有效的方式，用于组织场景中的语义信息并辅助智能体进行路径规划和目标定位。这类方法通常通过将环境建模为多个抽象层次的图结构，从而实现从高层语义指导到底层动作决策的高效导航。 ### 分层对象到区域图的核心思想 1. **区域划分与对象关联** 场景被划分为若干个功能区域（例如厨房、客厅、卧室等），每个区域内包含一组相关的物体对象（如厨房中包含冰箱、微波炉、餐桌等）。这种区域划分可以基于语义分割或空间聚类算法实现。 2. **图结构构建** 图中的节点包括： - 区域节点：表示不同功能区域。 - 对象节点：表示区域内的具体物体。 - 边缘关系：表示区域之间的连通性以及对象与区域之间的归属关系。 3. **分层推理机制** 导航过程通常分为两个阶段： - 高层策略网络：负责根据任务目标选择下一个目标区域。 - 底层策略网络：负责在选定的区域内寻找具体的物体目标，并生成低级动作指令。 ### 实现方法概述 #### 1. **场景感知与图构建** - 利用模拟器（如Matterport3D、AI2Thor）提供的深度、RGB图像及语义信息来检测物体并进行区域划分。 - 使用3D点云处理技术或语义分割模型（如Mask R-CNN）提取对象类别和位置信息。 - 构建图结构时，可以使用图神经网络（GNNs）或图注意力网络（GAT）来建模区域与对象之间的关系[^2]。 #### 2. **图神经网络的应用** - 图注意力网络（GAT）能够动态地学习区域与对象之间的依赖关系，适用于非规则连接的图结构。 - 图卷积网络（GCN）可用于聚合邻居节点的信息，增强图中节点的表示能力。 - 在训练过程中，图结构可以作为输入提供给策略网络，以辅助强化学习代理做出更合理的决策。 #### 3. **多层级策略网络设计** - 高层策略：基于当前区域的状态和任务目标，预测下一个要访问的区域。 - 底层策略：专注于在当前区域中识别目标对象，并控制机器人执行移动操作（如前向移动、旋转等）。 #### 4. **训练与评估** - 使用模仿学习（Imitation Learning）或深度强化学习（Deep RL）进行端到端训练。 - 常见奖励函数包括：接近目标的正奖励、碰撞惩罚、无效动作惩罚等。 - 评估指标包括成功率（SPL）、路径长度、与目标的距离等。 ### 示例代码框架（基于PyTorch与GNN）以下是一个简化的图构建与推理流程示例： ```python import torch import torch.nn as nn from torch_geometric.data import Data from torch_geometric.nn import GATConv class HierarchicalGraphModel(nn.Module): def __init__(self, num_region_classes, num_object_classes): super(HierarchicalGraphModel, self).__init__() self.region_embedding = nn.Embedding(num_region_classes, 64) self.object_embedding = nn.Embedding(num_object_classes, 64) self.gat1 = GATConv(64, 128, heads=4) self.gat2 = GATConv(512, 128) def forward(self, data: Data): x_region = self.region_embedding(data.region_x) x_object = self.object_embedding(data.object_x) x = torch.cat([x_region, x_object], dim=0) edge_index = data.edge_index x = self.gat1(x, edge_index) x = torch.relu(x) x = self.gat2(x, edge_index) return x # 示例数据构建 data = Data() data.region_x = torch.tensor([0, 1, 2]) # 区域ID data.object_x = torch.tensor([3, 4, 5, 6]) # 对象ID data.edge_index = torch.tensor([ [0, 1, 2, 0, 1, 2], [3, 4, 5, 6, 3, 5] ]) # 区域与对象间的连接边 ``` --- ###