自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 论文阅读:Video Visual Relation Detection via Iterative Inference

Video Visual Relation Detection via Iterative Inference基于迭代推理的视频视觉关系检测。论文地址:https://dl.acm.org/doi/abs/10.1145/3474085.3475263主要贡献提出了一种迭代关系推理方法,在其他两个组件的基础上逐步细化每个组件的类,可以利用关系组件的相互依赖性来实现更好的视觉关系识别;提出了一种新的训练方法来训练优先预测器,以便从可能正确的三元组合中更好地学习依赖性知识;提出了一个改进的VidV

2021-12-30 04:29:40 1898

原创 论文阅读笔记整理合集

视频关系预测相关1.一个同时提供动作标签和时空场景图标签的大型视频数据集合 Action Genome: Actions as Composition of Spatio-temporal Scene Graphs2. 用时空上下文的Transformer生成动态场景图 Spatial-Temporal Transformer for Dynamic Scene Graph Generation3. 视频视觉关系预测方法VidVRD Video Visual Relation Detection4.

2021-12-13 02:12:46 3233

原创 论文阅读:Action Genome: Actions as Composition of Spatio-temporal Scene Graphs

Action Genome: Actions as Composition of Spatio-temporal Scene GraphsAction Genome 是第一个同时提供动作标签和时空场景图标签的大型视频数据库。论文地址:https://arxiv.org/pdf/1912.06992.pdfGitHub地址:https://github.com/JingweiJ/ActionGenome官网地址:https://www.actiongenome.org/...

2021-12-13 02:03:28 2604 3

原创 论文阅读:Video Visual Relation Detection

Video Visual Relation Detection视频视觉关系预测方法VidVRD主要贡献出了一个新颖的VidVRD任务,旨在探索视频中物体之间的各种关系,它提供了一个比ImgVRD更可行的VRD任务;提出了一种VidVRD方法,通过目标轨迹建议、关系预测和贪婪关系关联来检测视频中的视觉关系;提供了第一个VidVRD评估数据集,包含1000个带有手动标记的视觉关系的视频。主要特点使用关系三元组<subject,predicate,object>∈C×P×C<

2021-12-12 00:53:56 919

原创 论文阅读:Target Adaptive Context Aggregation for Video Scene Graph Generation

1. 提出一种新的视频级VidSGG检测跟踪范式,称为**目标自适应上下文聚合网络TRACE**,可以将关系预测的上下文建模与复杂的底层实体跟踪分离开;2. TRACE简化了VidSGG管道,是一种纯框架级的VidSGG框架,在**获取时空上下文信息**进行**关系识别**方面具有更模块化的框架;3. .在TRACE中,提出了一种自适应结构,称为层次关系树HRTree。用于**高效地组织可能的关系候选**,实现了候选关系之间的**上下文信息聚合**,还可以**节省内存**,从而获得比全连接图更好的性能。

2021-12-11 02:22:05 2827 1

原创 论文阅读:Beyond Short-Term Snippet: Video Relation Detection with Spatio-Temporal Global Contex

超越短片段:基于时空上下文的视频关系检测提出了一个滑动窗口方案,同时预测短期和长期关系。在对象tracklet上运行具有不同内核大小的窗口来生成具有不同持续时间的子tracklet;构建了一个时空图,并利用图卷积网络生成上下文,进行兼容性评估,只预测高度兼容的对的关系。该方法在ImageNet-VidVRD和VidOR数据集上跨多个任务实现了最先进的性能。

2021-12-10 00:42:58 2088 1

原创 论文阅读:Spatial-Temporal Transformer for Dynamic Scene Graph Generation

论文阅读:Spatial-Temporal Transformer for Dynamic Scene Graph Generation论文地址:https://arxiv.org/abs/2107.12309github地址:https://github.com/yrcong/sttranSSTran是一种可以利用时空上下文的Transformer (STTran: Spatial-Temporal Transformer)来生成动态场景图 (Dynamic Scene Graph).主要贡献

2021-12-08 23:45:10 3557 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除