解决Cuda out of memory的一种思路 在实际做实验的过程中,cuda of memory问题很常见,在整理过网上的思路后,大致有如下几种:减小batch_size(常用)或减小模型参数和输入的大小(很少用到)。在测试过程中加上如下语句:with torch.no_grad()内存就不会分配参数梯度的空间。训练过程中遇到此情况可尝试在训练前释放cuda内存。nvidia-smi 查看gpu的使用率,若使用率不高就使用torch.cuda.empty_cache()释放内存这次又出现了新的问题,我将我遇到的情况总结如下:#在修
学习笔记:OriTripletLoss函数的解析 源码解析 1. 源代码class OriTripletLoss(nn.Module): """Triplet loss with hard positive/negative mining. Reference: Hermans et al. In Defense of the Triplet Loss for Person Re-Identification. arXiv:1703.07737. Code imported from https://github.com/
实验笔记:使用pycharm和github提交代码 1. pycharm设置打开pycharm File-> Settings -> Version Control -> Github 依次选择选项中内容。点击加号或者Add account,在弹出的对话框中输入自己的github账号密码:中间如果出现authe fail 404 not found的问题,试着将右边的网址填写上去,或者直接使用token的方式进行登录。Token方式登录。进入github右上角点击头像,然后settings -> Developer
行人重识别论文阅读14-Learning by Aligning- Visible-Infrared Person Re-identification 文章来源:Learning by Aligning- Visible-Infrared Person Re-identification using Cross-Modal Correspondences1. 解决的问题&总结1.1 解决的问题本文主要解决了VI-ReID问题:从一系列跨模态的人物图像中找到目标可见或红外光图像。假设人物图像粗略对齐,以前的方法是学习粗糙人物图像或固定部分级别的人物表示,而这些表示在不同模式中是有区别的,现有的方法裁剪的人物图像又不一定对齐,这会影响模型的效率
行人重识别论文阅读13-Parameter Sharing Exploration and Hetero-center Triplet Loss for Visible-Thermal Person Parameter Sharing Exploration and Hetero-center Triplet Loss for Visible-Thermal Person Re-Identification1. 解决的问题解决白天可见光和夜晚红外热成像的人员匹配问题,通过使用共享的双流网络进行研究。VT-ReID问题面临的两个问题:可见光和红外光的图片性质差别较大。由于摄像头视点变化和不同的人体姿势导致的模态内度量困难。一般此问题都是采用双流的网络解决,将不同模态的特征映射到公共空间中。
行人重识别论文阅读12-Bi-directional Exponential Angular Triplet Loss for RGB-Infrared Person ReID expAT:双向指数角度三元组损失Bi-directional Exponential Angular Triplet Loss for RGB-Infrared Person Re-Identification1. 解决的问题因为欧氏距离不能有效地测量角度可判别特征嵌入。并且因为角度鉴别特征空间对基于嵌入向量的行人图像分类十分重要。双向指数角度三重损失:通过显式约束嵌入向量之间的夹角帮助学习角度可分离的公共特征空间。2. 提出的方法作者提出双向指数角度三元组损失,使用余弦距离来衡量包括角度的距
行人重识别论文阅读11-BDTR 红外光行人重识别 Bi-Directional Center-Constrained Top-Ranking for Visible Thermal Person Re-IdentificationBDTR: 双向中心约束的排序损失1. 解决的问题红外光和可见光图像之间差异大,而且存在大量的噪声,无法学习可判别的特征。而现有的方法对噪声图像具有弱鲁棒性。多模态问题中出现模态间的特征映射关系不准确以及模态内变化巨大的问题。2. 模型概览提出双向中心聚合的排序损失函数同时考虑模态内和模态间的变化。提出双向中心约束
行人重识别论文阅读10-DDAG 动态双注意聚合学习策略 红外行人重识别的动态双注意力聚合学习Dynamic Dual-Attentive Aggregation Learning for Visible-Infrared Person Re-Identification1. 解决的问题:现有的VI-ReID倾向于全局表示,这种表示具有有限的可分辨率性和对噪声图像的弱鲁棒性。解决跨模态的行人重识别中模态对齐问题。2. 方法概述:提出动态双注意聚合的学习方法DDAG,通过挖掘VI-ReID的模态内部分级和跨模态图级上下文线索。模态内加权部分注意模块(IW
行人重识别论文阅读9-ViTAA:自然语言搜索中文本属性的视觉对齐 ViTAA:自然语言搜索中文本属性的视觉对齐概括:这篇文章解决了什么问题,用了什么方法,有什么效果,你有什么收获这篇文章从属性特定对齐学习的角度来解决自然语言中人员搜索的问题。方法:允许将特定属性短语固定到相应的视觉区域。模型学习使用一个辅助属性分割层将一个人的特征空间分解成与属性对应的子空间。然后,通过一种新颖的对比学习方法(k倒数采样),将这些视觉特征与从句子中解析出来的文本属性联系起来。收获:该方法充分利用不同身份的视觉和文本模式中的共同属性信息,并利用对齐学习模式在视觉属性特征和相应的文本短
行人重识别论文阅读8-FastReID京东快速行人重识别 7.22 京东 Fast-ReID论文阅读1. 解决的问题FastReID是京东AI研究中广泛使用的软件系统,有高度模块化和可扩展的设计,有好的可管理的系统配置和工程部署。FastReID是统一实例重标识库,允许其他人员将其他代码块插入到ReID系统,从而进一步快速的将研究思想转移到生产模型中。提供person reid,partial person reid,vehicle reid。2. 模型概述FastReID的亮点:模块化和可扩展设计:可以快速实现他们的想法,无需重写数十万行代码。可
行人重识别论文阅读7-基于图卷积的行人骨架识别 0. 怎么看论文怎么看论文:带着目的,你是想要解决什么问题,这篇论文的摘要能给你带来什么收获。摘要、结论:是否和你的研究方向高度相关,或者如果你应用这个模型能解决什么问题。引言部分:作者为什么额开展这项研究。这篇文章是否值得精读。深度挖掘结论和讨论部分:如何开展实验获得初始数据、数据分析解读数据内涵等。做笔记(Endnote、Mendeley):列出对自己有价值核心信息,方便后面定位相关文献。或者表格列出文献:序号、文献名称、文献类型、发表年份、关键部分、研究方法、存在
行人重识别论文阅读6-低分辨率的行人重识别研究 Learning Resolution-Invariant Deep Representations for Person Re-Identification学习分辨率不变的的深度表示用于行人重识别RAIN解决的问题现实场景查询图像可能会出现分辨率丢失的问题,这篇文章就是解决行人重识别中分辨率不匹配的问题。论文创新点提出新的网络结构解决跨分辨率的行人重识别,替代原有的应用图像超分辨率模型。提出对抗学习策略,提取分辨率不变的重识别表示,类似于自动编码器的结构,保留图像的标识能力。同时以端到端的训练方
行人重识别论文阅读5-基于换衣服的行人重识别 基于换衣服的行人重识别问题总结现有行人重识别的缺点:过度依赖衣服颜色导致将衣着相似的人混淆。本文基于人物图像的轮廓草图来执行跨服装的Re-ID,以利用人体的形状而不是颜色信息来提取对适度服装变化鲁棒的特征。算法概述假设短时间内行人轮廓变化不大并且天气也没有显著变化时,要从轮廓草图中提取可靠且有区别的曲线模式,轮廓草图为克服同一个人的图像之间的差异提供了可靠和有效地视觉线索。本文开发了一种基于学习的空间极坐标变换(SPT)来自动选择/采样相对不变的、可靠的和有区别的局部曲线模式。此外,我们引入角度特
行人重识别论文阅读4,行人重识别实验笔记1-无锚行人搜索框架 Anchor-Free Person Search无锚的行人搜索框架(AlignPS)Feature-Aligned Person Search Network(特征对齐的行人搜索网络)解决的问题解决不同级别的错位问题:提出对齐的特征聚合模块,通过遵循“reid first”的原则来生成更具有区分性和鲁棒性的特征嵌入。本文提出:无锚检测模型的典型架构,带有对齐特征聚合模块(AFA),AFA通过利用可变形卷积和特征融合来克服重识别特征学习中区域和尺度错位的问题,重塑FPN一些构造块。one
行人重识别论文阅读3-行人重识别中的部分对部分的对应学习(PPCL) Partial Person Re-identification with Part-Part Correspondence Learning行人重识别中的部分对部分的对应学习论文地址:Paper解决的问题将重点放在识别部分(有缺陷的)输入,借助部分-部分对应学习(PPCL),这是以种自监督学习框架,无需任何额外的部分级监督即可学习图像块之间的对应关系。同时将本文的模型应用于人脸识别中,效果也能提高。文章概述本文提出一个部分-部分对应学习(PPCL)解决部分行人重识别问题。提出门控布局整流器
行人重识别论文阅读2-视频中基于时空相关性和拓扑学习的行人重识别(CTL) 视频中基于时空相关性和拓扑学习的行人重识别Spatial-Temporal Correlation and Topology Learning for Person Re-Identification in Videos解决的问题:本文提出一个新的时空相关性和拓扑学习框架(CTL),通过建立跨尺度的时空相关性来追求有区别的和鲁棒的表示。利用一个CNN主干和一个关键点估计其从人体中提取多个粒度的语义局部特征作为图节点。通过考虑全局上下文信息和人体的物理联系,探索了一种上下文增强拓扑来构造多尺度图。
行人重识别论文阅读1-Watching You: Global-guided Reciprocal Learning for Video-based Person Re-identification 论文链接:GRL框架论文论文总结本文提出一个基于视频的全局引导的交互学习框架(GRL Global-guided Reciprocal Learning)。提出全局引导相关估计生成局部特征和全局特征的特征相关图,然后将区分特征分界为高相关特征和低相关特征。提出全局特征估计模块生成解纠缠视频表示下的引导图。提出一种新的TRL(时间交互学习)模块,可以有效监控信息和视频中的细粒度信息,用于依次增强高相关性语义信息和积累低相关性亚关键线索。模型特点:可以增强来自高相关区域的显著信息,还可以积累来