论文阅读:PANet:A Context Based Predicate Association Network for Scene Graph Generation(ICME19)

在这里插入图片描述
整个网络结构可以分成两部分,先说前半截:
在这里插入图片描述
深蓝、蓝、浅蓝三种颜色表示的特征分别为class embedding、spatial info、visual feature,cat后线性变换一下,得到特征V
在这里插入图片描述
之后再对整幅图像的所有主客体对计算出的V经过RNN,得到实例级别的上下文
在这里插入图片描述
整幅图像经过CNN提取的feature map线性变换一下,作为场景级别的上下文,然后与实例级别上下文相加得到融合上下文G,最终物体的类别由融合上下文得到在这里插入图片描述在这里插入图片描述

后半截:
在这里插入图片描述
红色箭头即为输入特征的计算方式:
主客体的上下文和union feature map的融合,得到U,即融合特征
在这里插入图片描述
然后把融合特征复制n份,分别与不同谓语的word embedding特征cat在一起,得到对齐特征R
这n种对齐特征输入RNN,得到n种谓语上下文特征
在这里插入图片描述
由于不同的谓语对最终的上下文影响不同,使用了注意力机制,最终的谓语上下文特征是这n种上下文的加权
在这里插入图片描述
谓语分类取决于谓语上下文特征:
在这里插入图片描述

------------------------------一些碎碎念-----------------------------
妈妈上班去了 要3月才能回来。
15551

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值