论文阅读计划的第15天
一、研究背景
目标检测要求检测器使用边界框定位图像中的对象,并为每个对象分配正确的类别。目标检测的关键挑战之一是协调解决两个子任务,即定位和分类。定位要求网络准确捕捉对象的位置,而分类则要求网络提取对象的语义信息。
特征融合有利于双重目标检测任务。一方面,当来自浅层和深层的高分辨率和低分辨率特征被融合时,细节和位置信息可以与语义信息相结合。另一方面,可以在不同的尺度上检测对象,提高了框架的健壮性。
二、研究内容
本文提出了一个多尺度融合模块(MSFM),它从一个单一的输入中提取细节和语义信息,但在同一层不同的尺度。具体来说,模块的输入将被调整到不同的比例,在这些比例上,位置和语义信息将被处理,然后它们将被重新缩放并与模块输入相结合。MSFM是轻量级的,可以用作许多现有对象检测框架的插入层。
三、研究方法
MSFM公式:
每个分支的计算:
多位置的消融实验:
模型参数的优越性: