自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 T2T ViT 源码解读

文章结构分文transformer 和performer结构def _cfg(url='', **kwargs): return { 'url': url, 'num_classes': 1000, 'input_size': (3, 224, 224), 'pool_size': None, 'crop_pct': .9, 'interpolation': 'bicubic', 'mean': (0.485, 0.456, 0.4

2021-08-10 19:53:09 889

原创 CVPR 2021 旷世团队提出YOLOF

CVPR 2021 旷世公司提出的YOLOFFPN的成功之处在于,它对目标检测优化问题的分治解决方案,而不是多尺度特征融合。本文不是采用复杂的特征金字塔——仅利用一级特征进行检测。提出了两个关键部分,空洞编码器和均匀匹配。在one-stage和two-stage的检测器中,FPN是非常重要的一部分,它主要带来两个好处:(1)多尺度特征融合:融合多个低分辨率和高分辨率特征输入以获得更好的表示;(2)分而治之: 根据物体的尺度在不同的层次上探测物体。通过将多尺度特征融合和分而治之与RetinaNet来设计

2021-04-17 16:38:27 713

原创 CVPR2020论文笔记——EfficientDet---双尺度特征融合BiFPN目标检测

代码:https://github.com/google/automl/tree/ master/efficientdet.摘要:提出了提高效率的几个关键优化提出了一种加权的双向特征金字塔网络,它允许简单和快速的多尺度特征融合提出了一种复合缩放方法,可以同时统一缩放所有主干、特征网络和bbx/类预测网络的分辨率、深度和宽度1.引言在融合不同输入特征的时候,以往的网络,对特征图总是不加以区分进行简单的计算,然后,由于不同输入特征拥有不同的分辨率,对融合后输出的特征的贡献是不一样的。为了解决这个问题

2021-03-15 15:11:48 8479

原创 CVPR2021 视频目标检测——MM-DistillNet 基于多模态知识提取的自监督多目标检测与跟踪论文笔记/附原文和代码

本文是CVPR2021最新的视频目标检测的论文原文地址:https://arxiv.org/abs/2103.01353v1代码:https://github.com/robot-learning-freiburg/MM-DistillNet注意:文中的“知识”可以理解为网络提取的特征图摘要对象固有的声音属性可以为学习对象检测和跟踪的丰富表示提供有价值的线索。①本文提出了一个新的自我监督的多媒体教学网络框架,该框架由多个teacher组成,他们利用包括RGB、深度和热图像在内的多种形式,同时利

2021-03-14 16:58:09 5149 9

原创 用于6D位姿估计的卷积神经网络:PoseCNN——笔记

创新点0.将输入图像分为三个任务:(1)语义分割(2)三维旋转(3)三维平移1.通过估计图像中物体的中心和与摄像机之间的距离来估计物体的三维平移。通过全连接层得到四元数估计物体的三维旋转。2.能够处理对称物体,被遮挡物体。3.本文贡献了一个用于6D目标姿态估计的RGB-D视频数据集YCB视频数据集。该数据集包含92个视频中来自YCB对象和模型集的21个对象,共133827帧。为每一帧提供...

2020-04-01 18:10:49 5230 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除