自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 目标检测学习笔记3---FCOS

anchor-free 这类算法性能优异的核心在于 bbox 正负样本分配,不同的 anchor-free 算法主要区别就在于此,或者说各类 anchor-free 算法最大创新点就在于此,在fcos中针对正负样本分配问题主要提出的有:1.匹配准则:点(x,y)不仅要在GT的范围内,还要离GT的中心点( cx , cy )足够近才能被视为正样本。2.当特征图上的某一点同时落入多个GT Box内时,默认将该点分配给面积Area最小的GT Box。

2024-03-09 19:20:17 1850

原创 目标检测学习笔记2---deformable-detr

one-stage全部流程提前在DeformableDETR中生成6个共享分类头和6个共享回归头。backbone输出3个不同尺度的特征,然后接上3个1x1conv和1个3x3conv,最后得到4个不同尺度的特征图;生成Encoder相对4个特征图固定的参考点xy坐标+4个不同尺度的特征图,输入encoder,得到增强版的特征图memory:[bs, H/8 * W/8 + H/16 * W/16 + H/32 * W/32 + H/64 * W/64, 256];

2024-03-06 12:17:38 896

原创 deformable-detr论文解析

传统detr受限于不能输入特别大的图像到网络,因为展开为一个序列输入到transformer中时,序列长度呈原图宽(高)的指数倍,而且在transformer中展开序列的每一个像素点都需要对全部像素点求注意力,增加图片尺寸对计算量的影响非常大。在deformable-detr中就提出每个位置都只对附近位置进行注意力计算,而不是对全部位置进行计算,降低了计算量。可变型卷积只知道这些点是重要特征,缺少对点与点之间的位置关系进行联系。

2024-03-06 12:16:32 2008

原创 目标检测学习笔记1-Detr源码分析

最近在学习detr,看完论文尝试着看源码,水平不行还是参考了很多大牛的解析,简单说一下看论文和源码的思路吧,我觉得这种方法还是很有帮助的。

2024-02-13 21:33:03 1746

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除