论文阅读：PANet：A Context Based Predicate Association Network for Scene Graph Generation(ICME19)

糖豆豆今天也要努力鸭

已于 2022-02-19 12:53:25 修改

阅读量1.6k

点赞数

分类专栏：机器学习文章标签：计算机视觉深度学习人工智能场景图生成 scene graph

于 2022-02-19 12:47:36 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40349484/article/details/123016855

版权

机器学习专栏收录该内容

37 篇文章

订阅专栏

在这里插入图片描述
整个网络结构可以分成两部分，先说前半截：

深蓝、蓝、浅蓝三种颜色表示的特征分别为class embedding、spatial info、visual feature，cat后线性变换一下，得到特征V

之后再对整幅图像的所有主客体对计算出的V经过RNN，得到实例级别的上下文
在这里插入图片描述
整幅图像经过CNN提取的feature map线性变换一下，作为场景级别的上下文，然后与实例级别上下文相加得到融合上下文G，最终物体的类别由融合上下文得到

后半截：
在这里插入图片描述
红色箭头即为输入特征的计算方式：
主客体的上下文和union feature map的融合，得到U，即融合特征

然后把融合特征复制n份，分别与不同谓语的word embedding特征cat在一起，得到对齐特征R
这n种对齐特征输入RNN，得到n种谓语上下文特征
在这里插入图片描述
由于不同的谓语对最终的上下文影响不同，使用了注意力机制，最终的谓语上下文特征是这n种上下文的加权

谓语分类取决于谓语上下文特征：

------------------------------一些碎碎念-----------------------------
妈妈上班去了要3月才能回来。
15551

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。