#今日论文推荐# 南洋理工提出全场景图生成PSG任务，像素级定位物体，还得预测56种关系

wwwsxn

已于 2022-08-24 22:27:36 修改

阅读量112

点赞数

分类专栏：深度学习文章标签：深度学习计算机视觉人工智能

于 2022-08-24 22:27:30 首次发布

原文链接：https://www.aminer.cn/research_report/63062c337cb68b460f0af5cc

版权

深度学习专栏收录该内容

716 篇文章 30 订阅

订阅专栏

#今日论文推荐# 南洋理工提出全场景图生成PSG任务，像素级定位物体，还得预测56种关系

现在已经2022年了，但是当下大多数的计算机视觉任务却仍然只关注于图像感知。比如说，图像分类任务只需要模型识别图像中的物体物体类别。
虽然目标检测，图像分割等任务进一步要求找到物体的位置，然而，此类任务仍然不足以说明模型获得了对场景全面深入的理解。
以下图1为例，如果计算机视觉模型只检测到图片中的人、大象、栅栏、树木等，我们通常不会认为模型已经理解了图片，而该模型也无法根据理解做出更高级的决策，例如发出「禁止投喂」的警告。

事实上，在智慧城市、自动驾驶、智能制造等许多现实世界的AI场景中，除了对场景中的目标进行定位外，我们通常还期待模型对图像中各个主体之间的关系进行推理和预测。
例如，在自动驾驶应用中，自动车需要分析路边的行人是在推车还是在骑自行车。根据不同的情况，相应的后续决策可能都会有所不同。而在智能工厂场景中，判断操作员是否操作安全正确也需要监控端的模型有理解主体之间关系的能力。
大多数现有的方法都是手动设置一些硬编码的规则。这使得模型缺乏泛化性，难以适应其他特定情况。
场景图生成任务（scene graph generation，或SGG）就旨在解决如上的问题。在对目标物体进行分类和定位的要求之上，SGG任务还需要模型预测对象之间的关系。

论文题目：Panoptic Scene Graph Generation
详细解读：https://www.aminer.cn/research_report/63062c337cb68b460f0af5cchttps://www.aminer.cn/research_report/63062c337cb68b460f0af5cc
AMiner链接：https://www.aminer.cn/?f=cs

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。