Learning to Detect Human-Object Interactions论文阅读笔记

前言

这是一篇2018年发表在CS上的论文,原文地址点这里
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

笔记

  1. 这篇文章主要的贡献有两个,一是在原来HICO数据集的基础上增加了instance annotation,即动-名词对的文字注释。二是提出了HO-RCNN网络。
  2. 注释部分没有什么好说的,比较有趣的是HO-RCNN网络,图三就是网络的结构,从图上来看,输入的图片被分成了三路,经过裁剪resize之后通过CNN提取特征,最后分别分类得到的损失相加作为最终整个网络的损失,以此来训练整个网络。
  3. 关键的地方在于网络的输入部分,三个支路简单来说就是一张图片的人物、物体、人物+物体。送进网络的其实就是先在一张图中框出人和物体,然后将人物框、物体框、人物-物体对框,但是由
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值