论文阅读：Neural Motifs: Scene Graph Parsing with Global Context

最新推荐文章于 2024-06-08 09:59:15 发布

Kivee123

最新推荐文章于 2024-06-08 09:59:15 发布

阅读量6.2k

点赞数 6

文章标签： scene understanding

本文链接：https://blog.csdn.net/qq_37014750/article/details/82528396

版权

Neural Motifs是CVPR2018提出的一种利用全局上下文进行场景图解析的方法。通过对场景中经常出现的子结构（motif）进行建模，该论文创建了一个强大的基线，它依赖于物体标签的条件频率来预测关系。在考虑物体重叠的限制后，结果进一步提升。尽管Neural Motifs在基线上的改进有限，但它揭示了在视觉图分析中考虑全局信息的重要性。实验表明，该模型在有交叠的边界框之间关系预测上表现出色，但可能不适合处理无交叠关系，如涉及动作和交互的场景。

摘要由CSDN通过智能技术生成

Neural-Motifs(CVPR2018)

文章链接
 官方github
Paper给motif的定义是：regularly appearing substructures in scene graph。
换句话说，subject和object的label对它们的relation影响很大，和DR-net差不多的想法，不过用了更复杂的网络来实现。基于motif的想法，paper提出了一个新的strong的baseline，直接用统计的relation关于物体label的条件频率进行预测，竟然state-of-art结果高，而再加上只有overlap的物体间才有关系时，结果更高了，而paper提出的方法，在这个strong baseline上只提高了1%左右，非常少。
Paper使用了基于vgg-16的faster R-CNN但是在visual genome数据集上finetune了detector。训练motif-net时，最开始使用object的ground truth训练，还采样了一些negtive relation，应该就是none relation吧，得到的网络用来进行predicate classification很好，但是和detector一起工作效果就很差了，于是paper又将detector和motif-net连接到一起，end-to-end的训练&#

最低0.47元/天解锁文章

Kivee123

关注

6
点赞
踩
18

收藏

觉得还不错? 一键收藏
3
评论
论文阅读：Neural Motifs: Scene Graph Parsing with Global Context

Neural-Motifs(CVPR2018) Paper给motif的定义是：regularly appearing substructures in scene graph。换句话说，subject和object的label对它们的relation影响很大，和DR-net差不多的想法，不过用了更复杂的网络来实现。基于motif的想法，paper提出了一个新的strong的base...
复制链接

扫一扫