经典/最新计算机视觉论文及代码推荐

今日推荐几篇最新计算机视觉方向的论文,全部都是基于最近很火的transformer框架来进行目标检测或跟踪,把这几篇论文和代码研究透,基本就对基于transformer的框架有个大概了解,具体内容详见论文原文和代码,。

transformer端到端检测

  • 论文题目:End-to-End Object Detection with Transformers

  • 论文链接:https://arxiv.org/pdf/2005.12872v3.pdf

  • 代码链接:https://github.com/facebookresearch/detr

作者提出了一种目标检测的新方法,将物体检测视为一个直接的集合预测问题,是第一个将 transformer 成功整合为检测 pipeline 中心构建块的目标检测框架。基于Transformers的端到端目标检测,没有NMS后处理步骤、真正的没有anchor,且对标超越Faster RCNN。


这篇论文是transformer框架目标检测的开山之作,真正使transformer从自然语言处理杀入到目标检测领域。

基于transformer的3D目标检测

  • 论文题目:An End-to-End Transformer Model for 3D Object Detection

  • 论文链接:https://arxiv.org/pdf/2109.08141v1.pdf

  • 代码链接:https://github.com/facebookresearch/3detr

作者提出了3DETR,一个基于Transformer的端到端三维点云物体检测模型。与现有的检测方法相比,3DETR需要对普通的Transformer块进行最小的修改,这些方法采用了一些特定的3D感应偏置。具体来说,作者发现,具有非参数查询和傅里叶位置嵌入的标准转化器与采用具有手工调整的超参数的三维特定运算器库的专门架构相比,具有优势。

用HOI变换器进行端到端的人与物互动检测

  • 论文题目:End-to-End Human Object Interaction Detection with HOI Transformer

  • 论文链接:https://arxiv.org/pdf/2103.04503v1.pdf

  • 代码链接:https://github.com/bbepoch/HoiTransformer

作者提出了HOI Transformer,以端到端的方式解决人与物体交互(HOI)检测问题。目前的方法要么将HOI任务解耦为物体检测和交互分类的独立阶段,要么引入代用的交互问题。相比之下,作者提出的HOI Transformer,通过消除对许多手工设计的组件的需要,简化了HOI管道。HOI Transformer从全局图像背景中推理出物体和人类的关系,并直接并行地预测HOI实例。

后续

下一期最新/经典视觉论文敬请期待!

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小小谢先生

支持知识付费

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值