新东西_乄洛尘的博客-CSDN博客

新东西

关注

文章平均质量分 96

关注数：文章数：4 文章阅读量：5075 文章收藏量：72

作者: 乄洛尘

2024年立下Flag, 6月份毕业(*^▽^*)~ 如有问题请留言或私信，笔者看到后会第一时间回复呦~ 论文阅读笔记系列保持不定期更新，稳定更新的话估计得等6月份之后啦~

展开

Ref 系列 UniRef++: Segment Every Reference Object in Spatial and Temporal Spaces 论文阅读笔记

基于指代的目标分割任务，有指代图像分割 referring image segmentation (RIS)、少样本图像分割 few-shot image segmentation (FSS)、指代视频目标分割 referring video object segmentation (RVOS) 和视频目标分割 video object segmentation (VOS)。这些任务要么利用语言或 masks 标注作为指代去分割出特定的目标。

原创 2023-12-29 21:25:36 · 1492 阅读 · 2 评论
RSIS 系列 Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation 论文阅读

首先指出 Referring Remote Sensing Image Segmentation (RRSIS) 指代遥感目标分割的粗略含义，与 RIS 一致，但是需要在航空图像中实现。于是本文引入一种旋转的多尺度交互网络 Rotated Multi-Scale Interaction Network (RMSIN)，其整合了一种内部尺度交互模块 Intra-scale Interaction Module (IIM) 来解决多尺度且细粒度的细节信息，以及一种跨尺度交互模块 Cross-scale Inte

原创 2023-12-25 19:09:46 · 1553 阅读 · 14 评论
大一统模型 Universal Instance Perception as Object Discovery and Retrieval 论文阅读笔记

所有的实例感知任务旨在发现利用 queries 查询到的目标，例如类别名、语言表达式、目标标注，但这一领域被划分为多个独立的子任务。于是本文提出了一种统一的实例感知模型 UNINEXT。UNINEXT 将多个实例感知任务划分为一个统一的目标发现和检索过程，通过改变输入的 promots 能够弹性地感知不同类型的目标。于是有一些好处：不同任务的数据和标签词汇能够用于训练统一的模型，而且有益于那些缺乏训练数据的任务；参数有效性，能够降低冗余的计算。

原创 2023-11-25 19:35:45 · 1912 阅读 · 5 评论
VL 任务 The Role of Chain-of-Thought in Complex Vision-Language Reasoning Task 论文阅读笔记

思维链的效果在语言任务中发挥了重要作用，特别是在需要复杂的感知和推理的视觉-语言任务中。基于人类处理信号的过程，本文提出 “描述后再决定” 的策略。这一策略提升了大概 50% 的性能，为视觉-语言中的推理任务奠定了坚实的基础。

原创 2023-11-19 19:16:23 · 118 阅读 · 0 评论

新东西

作者: 乄洛尘

Ref 系列 UniRef++: Segment Every Reference Object in Spatial and Temporal Spaces 论文阅读笔记

RSIS 系列 Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation 论文阅读

大一统模型 Universal Instance Perception as Object Discovery and Retrieval 论文阅读笔记

VL 任务 The Role of Chain-of-Thought in Complex Vision-Language Reasoning Task 论文阅读笔记