DETR模型是Facebook发布的基于Transformer模型的端对端对象检测任务模型-- DETR(detect Transformer模型)。
DETR模型首先使用CNN卷积神经网络搜集图片的核心特征点,然后把这些特征点整合起来,通过embedding方法,把特征图片转换到特征向量空间。然后根据标准Transformer模型的编码器与解码器进行注意力机制的计算,最后把计算后的数据进行图片对象的分类,并根据检测到的位置信息,提供对象box区域,方便我们画图。
上几期图文教程,我们分享了如何使用DETR模型进行对象检测以及代码实现过程,本期我们再分享一下基于transformer模型的DETR如何来进行对象分割。
! pip install git+https://github.com/cocodataset/panopticapi.git
from