自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 [paper阅读笔记][2023]Prompting Language-Informed Distribution for Compositional Zero-Shot Learning

组合零样本学习(Compositional Zero-Shot Learning, CZSL),本质上是如何通过语言信息增强的分布提示来提升模型对未见组合视觉概念的识别能力。

2024-07-26 18:28:50 493

原创 [paper阅读笔记][2023]Continual Instruction Tuning for Large Multimodal Models

在大型多模态模型(LMMs)中实现持续指令调整时,如何有效地维持对先前任务的记忆,同时学习新任务,避免因新任务学习而导致的灾难性遗忘。

2024-07-26 18:20:18 231

原创 [paper阅读笔记][AAAI2024]CoPL: Contextual Prompt Learning for Vision-Language Understanding

提出一种新的方法,名为Contextual Prompt Learning (CoPL),用于改进视觉-语言理解模型的泛化能力。

2024-07-25 21:47:53 653

原创 [论文阅读笔记][CVPR2023]All are Worth Words: A ViT Backbone for Diffusion Models

探索在扩散模型中是否可以摆脱传统的基于卷积神经网络(CNN)的 U-Net 结构的依赖。

2024-07-24 22:08:03 757

原创 [paper阅读笔记][CVPR2024]NoiseCollage: A Layout-Aware Text-to-Image Diffusion Model Based on ......

如何有效地利用文本和布局信息来生成高质量的多对象图像,同时避免文本和布局条件之间的不匹配(attention manipulation的局限性)以及生成图像质量的下降(iterative editing的局限性)。

2024-07-24 21:07:19 876

原创 [paper阅读笔记][CVPR2024]VRP-SAM: SAM with Visual Reference Prompt

利用带有语义标注的参考图像来指导分割目标图像中与参考图像中具有相同语义的物体或区域。为了突破SAM面对复杂目标和陌生场景泛化性不强的限制。

2024-07-23 16:34:19 735

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除