论文学习
文章平均质量分 93
JJxiao24
博客小白,一直努力
展开
-
Cross-Modality Person Re-identification with Memory-Based Contrastive Embedding
由于模态之间存在差异,VI-ReID 变得更具挑战性,即阶层间的混乱(模态之间)和阶层内的变化(如姿势、视点、光照、背景聚类、遮挡等)。作者提出基于聚合记忆的跨模态深度度量学习框架,该框架受益于越来越多的学习模态感知和模态不可知的质心代理,用于聚类对比和互信息学习。此外,为了抑制模态差异,同时利用历史和最新学习的聚类代理来增强跨模态关联。这种训练机制通过增加学习到的聚类代理的多样性来获得硬正参考,最终实现跨模态图像特征之间更强的“拉紧”效果。原创 2024-08-07 15:09:38 · 734 阅读 · 0 评论 -
跨模态、多模态、多任务之间的区别与联系
跨模态是指从一种模态的数据中学习,并将其知识应用到另一种模态的数据上。跨模态学习可以利用不同模态数据之间的隐含关系,从而提高模型的泛化能力。从图像数据学习,用于文本生成。从文本数据学习,用于图像生成。从语音数据学习,用于唇语识别。跨模态、多模态和多任务是人工智能领域中相互关联的概念,它们可以相互促进,共同推动人工智能技术的进步。原创 2024-04-22 13:42:21 · 1127 阅读 · 3 评论 -
深度学习今年来经典模型优缺点总结,包括卷积、循环卷积、Transformer、LSTM、GANs等
最后,再介绍一种人工神经网络:前馈神经网络(Feedforward Neural Networks,FNNs)。将一种语言的文本翻译为另一种语言。适用场景:用于序列数据处理,与 LSTM 类似。将图像分类为不同的物体或场景。案例:股票价格预测。适用场景:用于自然语言处理、机器翻译等。将口头语言转换为文本。适用场景:用于生成图像、音频、文本等。将图像分为不同的类别。适用场景:序列建模、自然语言处理等。适用场景:处理长序列和时间序列数据。适用场景:图像分类、目标检测等。适用场景:用于分类和回归任务。原创 2023-12-01 15:58:51 · 2066 阅读 · 0 评论 -
深度学习常见激活函数:ReLU,sigmoid,Tanh,softmax,Leaky ReLU,PReLU,ELU整理集合,应用场景选择
近年来常用激活函数集合,拒绝知识角落盲点原创 2023-11-22 11:18:18 · 3020 阅读 · 0 评论 -
LanguageBind: extending video-language pretraining to n-modality by languagebased semantic alignment
的多模态预训练方法,但它是通过间接对齐到图像的方式实现的,不适用于与语言模态的对齐,可能导致性能下降。(1)提出了基于语言的多模态预训练框架 LanguageBind,在预训练过程中通过对比学习将其他模态与语言模态对齐,并且这些模态在一个共享的嵌入空间内统一。的模态不可知编码器,保持权重矩阵 W0 不变,同时学习一个新的权重矩阵 BA。第一步是生成搜索词数据库,设计一种独特的搜索词获取策略,利用来自各种视觉任务数据集的文本数据,包括标签和标题,以构建具有丰富视觉概念和多样性的视频数据集。原创 2023-11-15 16:55:14 · 701 阅读 · 0 评论 -
Progressive Attribute Embedding for Accurate Cross-modality Person Re-ID—效果可以说是领域最强的一篇文章
属性加图像信息进行融合提取特征原创 2023-10-24 22:03:56 · 238 阅读 · 0 评论 -
Self-Supervised Modality-Aware Multiple Granularity Pre-Training for RGB-Infrared Person Re-ID—通用范式
作者提出了一种自监督的预训练方案,模态感知多粒度学习(MMGL),它仅在多模态 ReID 数据集上从头开始直接训练模型,但在不使用任何外部数据或复杂的调整技巧的情况下,与 ImageNet 预训练相比,可以获得有竞争力的结果。来表示随机混洗的图像补丁序列的排序向量,该模块旨在学习用置换矩阵 P 重建其原始序列 O ,在数学上,P 属于 0-1 双随机矩阵的集合,其中第 i 行和第 j 列中的每个非零元素都表明当前第 i 个补丁应该分配到序列的第 j 位(可以理解为 P 是用来进行转置的矩阵)。原创 2023-08-20 10:52:18 · 168 阅读 · 0 评论 -
Learning Progressive Modality-shared Transformers for Effective Visible-Infrared Person Re-id
在本文中,我们提出了一种新的基于深度学习的框架PMT,该框架通过充分挖掘可靠的模态变量特征,有效地提高了VI ReID的性能。以灰度图像作为辅助模态,我们的框架通过渐进学习策略缓解了RGB-IR模态之间的巨大差距。同时,我们提出的MSEL和DCL可以有效地提取更可靠和更具判别力的特征,带来更强的性能和鲁棒性。此外,所提出的方法具有很好的推广性。通过将我们的方法应用于基于CNN的主干网,它们也可以带来显著的性能改进。在两个公共VI ReID基准上的实验结果验证了我们提出的框架的有效性。原创 2023-07-11 21:47:36 · 591 阅读 · 0 评论 -
Shape-Erased Feature Learning for Visible-Infrared Person Re-Identification
假设体型信息和身份相关的模态共享信息(虚线框表示)部分重叠。为了使提取的特征更加多样化,我们提出了形状擦除特征学习范式,将表征分解为形状相关特征和形状擦除特征。学习形状擦除特征驱动模型发现除身体形状之外更丰富的模态共享语义概念。原创 2023-06-06 19:53:31 · 1220 阅读 · 0 评论 -
Diverse Embedding Expansion Network and Low-Light Cross-Modality Benchmark for V-I Re-ID:如何有效利用生成嵌入?
生成嵌入的引用,结合于自注意力机制。原创 2023-06-06 17:15:04 · 1567 阅读 · 10 评论 -
Cross-Modality Transformer for Visible-Infrared Person Re-Identification—跨模态的另一开篇之作,思想借鉴了以往研究,并作出改进
跨模态行人重识别的新研究方向原创 2023-04-09 20:12:35 · 1191 阅读 · 0 评论 -
TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE—Vision Transformer(ViT)论文详解
vision transformer详细分析,会时常更新一些自己对transformer的理解。原创 2023-03-29 11:29:44 · 514 阅读 · 0 评论 -
EDTER: Edge Detection with Transformer—边缘检测,效果远超之前的研究
基于Transformer的边缘检测,可以精读研究原创 2023-03-25 21:58:28 · 2516 阅读 · 2 评论 -
Homogeneous and Heterogeneous Relational Graph for Visible-infrared Person Re-identification——基线结果很好
一篇精度很高的文章,baseline质量还不错。原创 2023-03-23 21:39:54 · 367 阅读 · 0 评论 -
计算机专业研究方向相关论文查找方法,分享给大家,实测有用。
论文文献查找的方法合集原创 2023-03-08 08:32:10 · 3787 阅读 · 0 评论 -
CMTR: Cross-modality Transformer for Visible-infrared Person Re-identification
跨模态行人重识别,一种挑战传统学习方法的研究方法。原创 2023-03-03 19:56:44 · 985 阅读 · 2 评论 -
NFormer: Robust Person Re-identification with Neighbor Transformer—基于Transformer的研究,注意公式简化过程,降低计算成本
行人重识别的新式应用。原创 2023-02-28 21:01:51 · 677 阅读 · 0 评论 -
TransReID: Transformer-based Object Re-Identification—一篇媲美CNN学习框架
基于Transformer框架的行人重识别,衍生了新的研究方法原创 2023-02-26 19:30:59 · 1031 阅读 · 1 评论 -
Learning by Aligning: Visible-Infrared Person Re-identification using Cross-Modal Correspondences
Learning by Aligning: Visible-Infrared Person Re-identification using Cross-Modal Correspondences原创 2023-02-13 21:41:20 · 407 阅读 · 0 评论 -
Dual-granularity feature fusion network for cross-modality person re- identification—利用轮廓信息进行特征融合
双粒度特征融合网络的跨模态行人再识别,一篇质量还不错的中文论文,通过对轮廓特征的加深使用,全局粗粒度融合和局部细粒度融合的结合使用,精确度还算取得了不错的精确度。原创 2023-02-12 22:59:43 · 472 阅读 · 0 评论 -
Syncretic Modality Collaborative Learning for Visible Infrared Person Re-Identification—建立融合模态,三模态共享
Syncretic Modality Collaborative Learning for Visible Infrared PersonRe-Identification,一种简单的框架图,主要是通过融合模态进行共享学习,对融合模态进行了适当的控制,与通道增强学习可以做对比。ran-k为67%。原创 2023-02-10 23:41:19 · 681 阅读 · 0 评论 -
Cross-Modality Person Re-Identification via Modality-Aware Collaborative Ensemble Learning—新颖的改进网络框架
Cross-Modality Person Re-Identification via Modality-aware ECollaborativensemble Learning,叶芒老师的一篇具有新颖文章原创 2023-02-07 21:02:40 · 370 阅读 · 0 评论 -
Cross-Modality Person Re-Identification via Modality Confusion and Center Aggregation—这是一篇观点比较新颖的文章
Cross-Modality Person Re-Identification via Modality Confusionand Center Aggregation,一种新的用于行人重识别的方法。原创 2023-02-06 17:57:03 · 484 阅读 · 0 评论 -
CM-NAS: Cross-Modality Neural Architecture Search for Visible-Infrared Person Re-Identification
CM-NAS: Cross-Modality Neural Architecture Search for Visible-Infrared Person Re-Identification,一篇有研究价值的论文原创 2023-01-03 20:18:10 · 321 阅读 · 1 评论 -
Discover Cross-Modality Nuances for Visible-Infrared Person Re-Identification(超详细分析,一看就懂)
发现用于可见-红外行人重识别的跨膜态细微差别原创 2022-10-28 11:24:14 · 1037 阅读 · 4 评论 -
Cross-modality Person re-identification with Shared-Specific Feature Transfer—2020CVPR,逐句分析
基于特定特征转移学习的跨模态行人重识别论文分析,欢迎大家指正学习。原创 2022-11-24 23:19:20 · 383 阅读 · 0 评论 -
Modality-Adaptive Mixup and Invariant Decomposition for RGB-Infrared Person Re-Identification(逐句分析)
Modality-Adaptive Mixup and Invariant Decomposition for RGB-InfraredPerson Re-Identification—全文分析,更好的理解文章思路原创 2022-11-17 19:29:55 · 1370 阅读 · 2 评论 -
Channel Augmented Joint Learning for Visible-Infrared Recognition—详细分析,建议收藏
来自于ICCV2021年的一篇精确度较高的论文,Channel Augmented Joint Learning for Visible-Infrared Recognition原创 2022-11-11 15:19:37 · 1597 阅读 · 1 评论 -
2023年最新计算机视觉领域论文查找链接总结—最近五年,直链论文,建议收藏
总结了一些在论文学习过程中所使用到的论文阅读地址,供大家参考学习,包括顶刊,顶会,一些知名中文期刊,中文学报等等,大家有兴趣,收藏自提。原创 2022-11-05 16:31:00 · 6937 阅读 · 1 评论 -
Neural Feature Search for RGB-Infrared Person Re-Identification详细分析
Neural Feature Search for RGB-Infrared Person Re-Identification原创 2022-10-31 15:48:40 · 323 阅读 · 0 评论