上期图文教程,我们分享了DETR模型,一个使用transformer模型的对象检测任务模型
此模型是Facebook发布的基于Transformer模型的端对端对象检测任务模型-- DETR(detect Transformer模型)。DETR模型首先使用CNN卷积神经网络搜集图片的核心特征点,然后把这些特征点整合起来,通过embedding方法,把特征图片转换到特征向量空间。然后根据标准Transformer模型的编码器与解码器进行注意力机制的计算,最后把计算后的数据进行图片对象的分类,并根据检测到的位置信息,提供对象box区域,方便我们画图。
上期教程,我们分享了如何使用TorchHub集成的DETR模型来进行对象检测任务,本期我们介绍一下如何使用hugging face集成的DETR模型进行对象检测任务。