paper阅读笔记
文章平均质量分 88
平常看paper的阅读笔记
瘦小星
希望能每天学习一点点!!!
展开
-
[paper阅读笔记][2023]Prompting Language-Informed Distribution for Compositional Zero-Shot Learning
组合零样本学习(Compositional Zero-Shot Learning, CZSL),本质上是如何通过语言信息增强的分布提示来提升模型对未见组合视觉概念的识别能力。原创 2024-07-26 18:28:50 · 493 阅读 · 0 评论 -
[paper阅读笔记][2023]Continual Instruction Tuning for Large Multimodal Models
在大型多模态模型(LMMs)中实现持续指令调整时,如何有效地维持对先前任务的记忆,同时学习新任务,避免因新任务学习而导致的灾难性遗忘。原创 2024-07-26 18:20:18 · 231 阅读 · 0 评论 -
[paper阅读笔记][AAAI2024]CoPL: Contextual Prompt Learning for Vision-Language Understanding
提出一种新的方法,名为Contextual Prompt Learning (CoPL),用于改进视觉-语言理解模型的泛化能力。原创 2024-07-25 21:47:53 · 653 阅读 · 0 评论 -
[论文阅读笔记][CVPR2023]All are Worth Words: A ViT Backbone for Diffusion Models
探索在扩散模型中是否可以摆脱传统的基于卷积神经网络(CNN)的 U-Net 结构的依赖。原创 2024-07-24 22:08:03 · 757 阅读 · 0 评论 -
[paper阅读笔记][CVPR2024]VRP-SAM: SAM with Visual Reference Prompt
利用带有语义标注的参考图像来指导分割目标图像中与参考图像中具有相同语义的物体或区域。为了突破SAM面对复杂目标和陌生场景泛化性不强的限制。原创 2024-07-23 16:34:19 · 735 阅读 · 0 评论 -
[paper阅读笔记][CVPR2024]NoiseCollage: A Layout-Aware Text-to-Image Diffusion Model Based on ......
如何有效地利用文本和布局信息来生成高质量的多对象图像,同时避免文本和布局条件之间的不匹配(attention manipulation的局限性)以及生成图像质量的下降(iterative editing的局限性)。原创 2024-07-24 21:07:19 · 876 阅读 · 0 评论