经典/最新计算机视觉论文及代码推荐

小小谢先生

已于 2022-06-11 11:48:47 修改

阅读量664

点赞数

分类专栏：计算机视觉论文及代码推荐文章标签： transformer 深度学习计算机视觉

于 2022-06-11 11:48:25 首次发布

本文链接：https://blog.csdn.net/xiewenrui1996/article/details/125233131

版权

计算机视觉论文及代码推荐专栏收录该内容

12 篇文章 7 订阅

订阅专栏

今日推荐几篇最新计算机视觉方向的论文，全部都是基于最近很火的transformer框架来进行目标检测或跟踪，把这几篇论文和代码研究透，基本就对基于transformer的框架有个大概了解，具体内容详见论文原文和代码，。

transformer端到端检测

论文题目：End-to-End Object Detection with Transformers
论文链接：https://arxiv.org/pdf/2005.12872v3.pdf
代码链接：https://github.com/facebookresearch/detr

作者提出了一种目标检测的新方法，将物体检测视为一个直接的集合预测问题，是第一个将 transformer 成功整合为检测 pipeline 中心构建块的目标检测框架。基于Transformers的端到端目标检测，没有NMS后处理步骤、真正的没有anchor，且对标超越Faster RCNN。

这篇论文是transformer框架目标检测的开山之作，真正使transformer从自然语言处理杀入到目标检测领域。

基于transformer的3D目标检测

论文题目：An End-to-End Transformer Model for 3D Object Detection
论文链接：https://arxiv.org/pdf/2109.08141v1.pdf
代码链接：https://github.com/facebookresearch/3detr

作者提出了3DETR，一个基于Transformer的端到端三维点云物体检测模型。与现有的检测方法相比，3DETR需要对普通的Transformer块进行最小的修改，这些方法采用了一些特定的3D感应偏置。具体来说，作者发现，具有非参数查询和傅里叶位置嵌入的标准转化器与采用具有手工调整的超参数的三维特定运算器库的专门架构相比，具有优势。

用HOI变换器进行端到端的人与物互动检测

论文题目：End-to-End Human Object Interaction Detection with HOI Transformer
论文链接：https://arxiv.org/pdf/2103.04503v1.pdf
代码链接：https://github.com/bbepoch/HoiTransformer

作者提出了HOI Transformer，以端到端的方式解决人与物体交互（HOI）检测问题。目前的方法要么将HOI任务解耦为物体检测和交互分类的独立阶段，要么引入代用的交互问题。相比之下，作者提出的HOI Transformer，通过消除对许多手工设计的组件的需要，简化了HOI管道。HOI Transformer从全局图像背景中推理出物体和人类的关系，并直接并行地预测HOI实例。