知识图谱在深度学习目标检测中的应用

知识图谱是什么?深度学习的目标检测怎么和它相结合?我将带大家一起来解读其中奥秘——阿波,2020.4.16

写在前面

知识图谱Reasoning-RCNN: Unifying Adaptive Global Reasoning —— 推理RCNN:统一自适应全局推理

应用介绍:Bootstrapping Knowledge GraphsFrom Images and Text —— 从图像和文本中引导知识图形

我将从先从知识图谱的介绍着手,浅要分析在深度学习目标检测任务中,各目标之间的相对关系是如何提升检测器精度的,并给出一篇论文范例。

先说结论:知识图谱将检测器中的类别之间的关系进行训练,确实能够提高我们的检测算法准确度,并且在很大程度上对目标之间的关系进行了解释。步骤是通过三元(object、predicate、subject )组合来进行分析的,有一个并行的语义池来单独训练,最后合并到原来的算法输出的特征图上(得到 Enhanced feature )。但是对于它错综复杂的关系网络和干扰,如何“因地适宜”正确使用便非常重要。

知识图谱

本文的亮点是将knowledge graph引入进来,增强对检测效果的识别。从信息论的角度,引入额外的信息,可以做到更好的结果。而从人的角度来说,人在对一件事物进行推理的时候,是将大脑中的已知信息结合起来,再进行推理思考。

Abstract

与一般的检测不同的是,本文的检测目标是大规模的数据检测,然而,传统的一些检测算法只是进行了检测,每个区域之间都是相互独立的,而这篇文章中,考虑一些语义的联系,对检测出来的物体之间进行推理,本文提出的方法是RCNN。在几个检测数据集上,取得了很好的提升。

Introduction

目前的大规模目标检测算法倾向于是学习数量很多的类别,一些数据类别的数量很少,严重不均衡,现如今的检测方法缺乏像人类一样的常识推理能力,因此如何去将当前的检测系统与reason结合在一起。(引入额外的信息是非常必要的。)
在这里插入图片描述

如上图 a 中的右上角部分,有一个模糊的白色的物体,我们人的思维方式就是去思考:

首先它很像一个CCTV(也就是闭路是摄像机),我们之前在 b 图中看到过。 其次再观察他的周围,是马路车,一个小的金属设备在监视着着车,所以他应该就是一个CCTV。 b 图中展示了其对象之间的图谱关系,这个就可以放到知识图谱里面去并且合并到 detection pipline 中。
在这里插入图片描述

Base Detecter

在这里插入图片描述
这部分的意思是将原本检测器中Proposal部分的类别进行提取,送入右边的全局语义池进行处理,传递的参数为分类器权重和注意力系数。

Knowledge Graph

在这里插入图片描述
我们可以看到在这一部分自动生成了全局语义池,将注意力系数和分类器权重和注意力系数导入其中进行向量关系的建立和训练。并将结果——自适应全局推理输出给右边的 Feature Map

(分类器关于每个类别的权重实际上包含了高层次的语义信息,因为在训练这个分类器的时候,其是整个图片进行了参与,分类器的参数不断更新,global pool也不断被训练),然后知识图谱被引入,并将其输入到自适应推理模块。

Feature Map

在这里插入图片描述

通过refine的模块去产生一个增强的特征。 这个增强的模块是通过拼接而形成的。 图中是蓝色与绿色。

其实可以看出,通过将全局语义池的结果拼接到原本的RCNN特征中,起到了一个特征增强的效果,从某种程度上来说,确实可以起到提高准确度的效果。

回顾Faster RCNN

在这里插入图片描述

Region Proposal Networks。RPN网络用于生成region proposals。该层通过softmax判断anchors属于foreground或者background,再利用bounding box regression修正anchors获得精确的proposals。

将RPN的输出转变为Object Proposals。提名候选区域,以备后面进行分类。

Roi Pooling。该层收集输入的feature maps和proposals,综合这些信息后提取proposal feature maps,送入后续全连接层判定目标类别。

Model

在这里插入图片描述
f = { f i } i = 1 N r , f i ∈ R D \mathbf{f}=\left\{f_{i}\ri

评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值