自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 Unlocking Attributes’ Contribution to SuccessfulCamouflage: A Combined Textual and VisualAnalysis

COD-TAX数据集分布概述: (a) 17个属性类分为三个类别,比例显示平均贡献,Max表示最高出现。(b)文本描述长度,(c)词频词云,(d)两个COD-TAX示例。属性被系统地分为三个主要类别:周围因子(SF)、伪装物体-自我因子(共价有机框架)和成像质量因子(IQF),如图1a所示。这种分类阐明了伪装的起源,区分了外部环境的影响,伪装实体的固有特征,以及摄影技术所施加的限制。每个类别都很详细,包括17个不同的因素,图1显示了一个彻底的分类。注释和细化过程。

2024-08-28 21:32:39 984

原创 Diffusion Models Beat GANs on Image Classification

虽然许多无监督学习模型关注于一个任务家族,无论是生成性的还是歧视性的,但我们探索了一个统一的表征学习者的可能性:一个使用单一的训练前阶段来同时处理两个任务家族的模型。我们确定扩散模型作为一个主要的候选模型。扩散模型作为一种最先进的图像生成、去噪、内画、超分辨率、操作等方法而日益突出。这种模型包括训练一个U-Net来迭代预测和去除噪声,所得到的模型可以合成高保真度、多样化、新颖的图像。U-Net体系结构,作为一种基于卷积的体系结构,以中间特征映射的形式生成一组不同的特征表示。

2024-08-15 10:24:11 572

原创 Large Model Based Referring Camouflaged Object Detection

本文提出了一种多层的伪装目标检测(MLKG)多模态方法(Ref-COD)。该方法利用多模态大语言模型(mllm)的语义智能和内在知识,以类似人的方式分解Ref-COD的复杂任务。MLKG方法组织来自mllm的多层次知识描述,指导分割模型逐步感知伪装目标和伪装场景,同时将文本参考与伪装照片对齐。本文的贡献包括探索mllm对Ref-COD和COD的使用,将Ref-COD分解为两个角度以更好地解释,以及在Ref-COD和COD基准上实现最先进的性能。

2024-07-31 17:32:10 926

原创 目标对象排名有关的论文阅读

显著目标检测的显著对象排名

2023-07-24 13:02:28 43

原创 LSR阅读笔记

Simultaneously Localize, Segment and Rank the Camouflaged Objects

2023-07-18 16:47:24 236 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除