![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
DETR目标检测系列源代码及改进精讲
文章平均质量分 93
DETR是目标检测领域的新框架,近几年在其基础上产生了多达数十种改进,将针对DETR及其数十种改进算法的源代码进行逐行代码精讲,并且提出改进idea和代码实现
量子-Alex
这个作者很懒,什么都没留下…
展开
-
【DETR系列目标检测算法代码精讲】01 DETR算法03 Dataloader代码精讲
定义了一个函数nested_tensor_from_tensor_list,该函数接受一个Tensor列表(tensor_list)作为输入,并返回一个NestedTensor对象。NestedTensor是一个特殊的数据结构,通常用于表示图像数据,其中可以包含不同大小的图像,并且有一个与之对应的掩码(mask)来表示每个图像的实际大小。默认的batch为2,我们输入的就是包含了两个元素的list,其中每个元素都是我们从dataset的__getitem__方法获得的输出。原创 2024-04-01 22:31:44 · 214 阅读 · 0 评论 -
【DETR系列目标检测算法代码精讲】01 DETR算法02 DETR算法数据预处理+图像增强+dataset代码精讲
首先定义了一个名为Compose的新类,它继承自object。在Python 3中,所有类都是新式类,即使你不显式地继承自object。同时接收一个transforms的list,类的初始化方法。当创建一个Compose对象时,需要传入一个转换操作的列表transforms。transforms的列表里面定义了一系列的转换操作。接受两个参数:image和target,并返回处理后的image和target。defcall这是一个特殊的方法,使得Compose类的实例可以被像函数一样调用。原创 2024-04-01 21:24:37 · 266 阅读 · 1 评论 -
【DETR系列目标检测算法代码精讲】01 DETR算法01 DETR算法框架和网络结构介绍
总所周知,传统的目标检测算法非常依赖于anchor和nms等手工设计操作,非常费时费力,自然而然的就产生了取消这些操作的想法。但是我们首先需要思考的是,为什么我们需要anchor和nms?因为我们是没有指定anchor去具体预测哪一个目标的,而且nms操作是建立在纯粹的边界框的距离上的,它完全没有利用到图像的信息,只是根据两个边界框的IoU去做判断,这样造成了两个问题。原创 2024-03-30 21:17:50 · 773 阅读 · 0 评论