Yolov5 网络构建代码(1)- Detect

 在该目录下存放着yolo.py文件,里面的代码是关于网络构建相关的。

里面其实就写了两个class,一个是Detect,一个是Model

 Detect

class Detect(nn.Module):
    stride = None  # strides computed during build
    onnx_dynamic = False  # ONNX export parameter

    def __init__(self, nc=80, anchors=(), ch=(), inplace=True):  # detection layer
        super().__init__()
        self.nc = nc  # number of classes
        self.no = nc + 5  # number of outputs per anchor
        self.nl = len(anchors)  # number of detection layers
        self.na = len(anchors[0]) // 2  # number of anchors
        self.grid = [torch.zeros(1)] * self.nl  # init grid
        self.anchor_grid = [torch.zeros(1)] * self.nl  # init anchor grid
        self.register_buffer('anchors', torch.tensor(anchors).float().view(self.nl, -1, 2))  # shape(nl,na,2)
        self.m = nn.ModuleList(nn.Conv2d(x, self.no * self.na, 1) for x in ch)  # output conv
        self.inplace = inplace  # use in-place ops (e.g. slice assignment)

    def forward(self, x):
        z = []  # inference output
        for i in range(self.nl):
            x[i] = self.m[i](x[i])  # conv
            bs, _, ny, nx = x[i].shape  # x(bs,255,20,20) to x(bs,3,20,20,85)
            x[i] = x[i].view(bs, self.na, self.no, ny, nx).permute(0, 1, 3, 4, 2).contiguous()

            if not self.training:  # inference
                if self.grid[i].shape[2:4] != x[i].shape[2:4] or self.onnx_dynamic:
                    self.grid[i], self.anchor_grid[i] = self._make_grid(nx, ny, i)

                y = x[i].sigmoid()
                if self.inplace:
                    y[..., 0:2] = (y[..., 0:2] * 2. - 0.5 + self.grid[i]) * self.stride[i]  # xy
                    y[..., 2:4] = (y[..., 2:4] * 2) ** 2 * self.anchor_grid[i]  # wh
                else:  # for YOLOv5 on AWS Inferentia https://github.com/ultralytics/yolov5/pull/2953
                    xy = (y[..., 0:2] * 2. - 0.5 + self.grid[i]) * self.stride[i]  # xy
                    wh = (y[..., 2:4] * 2) ** 2 * self.anchor_grid[i]  # wh
                    y = torch.cat((xy, wh, y[..., 4:]), -1)
                z.append(y.view(bs, -1, self.no))

        return x if self.training else (torch.cat(z, 1), x)

    def _make_grid(self, nx=20, ny=20, i=0):
        d = self.anchors[i].device
        yv, xv = torch.meshgrid([torch.arange(ny).to(d), torch.arange(nx).to(d)])
        grid = torch.stack((xv, yv), 2).expand((1, self.na, ny, nx, 2)).float()
        anchor_grid = (self.anchors[i].clone() * self.stride[i]) \
            .view((1, self.na, 1, 1, 2)).expand((1, self.na, ny, nx, 2)).float()
        return grid, anchor_grid

先看__init__初始化方法:一开始是接受的了4个数据 nc=80, anchors=(), ch=(), inplace=True

nc:分类总数  默认是80个类别是coco数据集的。

anchors:每一个feature map上先验框大小。    每个维度存放了3个框的大小                                  里面数据存储方式是[[10,13,16,30,33,23],[30,61,62,45,59,119],[116,90,156,198,373,326]]

ch:3个feature map的通道数      [128,256,512]

inplace: 一般都是True 默认不使用AWS Inferentia加速

self.nc = nc  # 重写了分类数
self.no = nc + 5  # 每个先验框输出的结果,前面的nc是目标类得分 + 先验框的数据[x, y, h, w, p(目标检测得分)]
self.nl = len(anchors)  # 检测维度,一般是3,
self.na = len(anchors[0]) // 2  # 先验框的个数,一般也是3
self.grid = [torch.zeros(1)] * self.nl  # 全是1的格子
self.anchor_grid = [torch.zeros(1)] * self.nl  # 先验框的格子
        
# 模型中需要保存的参数一般有两种:一种是反向传播需要被优化器更新的,称为parameter; 
# 一种不要被优化器更新称为buffer
# 不需要被更新的参数,我们需要创建一个tensor,然后通过register_buffer去注册
# 可以通过model.buffers() 返回,注册后的参数也会被自动保存到OrderDict中去。
# 需要注意的是buffer的参数更新是在forward中,而optim.step只能更新nn.parameter类型的参数
self.register_buffer('anchors', torch.tensor(anchors).float().view(self.nl, -1, 2))  # shape(nl,na,2)
        
self.m = nn.ModuleList(nn.Conv2d(x, self.no * self.na, 1) for x in ch)  # output conv   1*1的卷积
        
# 一般都是True 默认不使用AWS Inferentia加速
self.inplace = inplace  # use in-place ops (e.g. slice assignment)

接下来就是forward方法

def forward(self, x):
    # 先将z赋值成一个空列表
    z = []  # inference output
    
    # 然后对每一个检测维度进行迭代
    for i in range(self.nl):
        
        # 先进行一个1*1的卷积操作,统一维度,便于拼接
        # [bs, 128/256/512, 80, 80] - [bs, 75, 80, 80]
        x[i] = self.m[i](x[i])  # conv  
        
        
        # 取出x的维度
        bs, _, ny, nx = x[i].shape  # x(bs,255,20,20) to x(bs,3,20,20,85)
        # 调整顺序
        x[i] = x[i].view(bs, self.na, self.no, ny, nx).permute(0, 1, 3, 4, 2).contiguous()
        
      # 判断是否是训练模式,为训练模式则不工作
        """
        因为推理返回的不是归一化后的网格偏移量 需要再加上网格的位置 得到最终的推理坐标 再送入nms
        所以这里构建网格就是为了纪律每个grid的网格坐标 方面后面使用
        """
         # 如果当前模式为预测推理模式
        if not self.training:  # inference 推理
            if self.grid[i].shape[2:4] != x[i].shape[2:4] or self.onnx_dynamic:
                    self.grid[i], self.anchor_grid[i] = self._make_grid(nx, ny, i)

            y = x[i].sigmoid()

            """
            默认执行 不使用AWS Inferentia
            这里的公式和yolov3、v4中使用的不一样 是yolov5作者自己用的 效果更好
            """
            if self.inplace:
               y[..., 0:2] = (y[..., 0:2] * 2. - 0.5 + self.grid[i]) * self.stride[i]  # xy
               y[..., 2:4] = (y[..., 2:4] * 2) ** 2 * self.anchor_grid[i]  # wh
            else: 
               xy = (y[..., 0:2] * 2. - 0.5 + self.grid[i]) * self.stride[i]  # xy
               wh = (y[..., 2:4] * 2) ** 2 * self.anchor_grid[i]  # wh
               y = torch.cat((xy, wh, y[..., 4:]), -1)
               z.append(y.view(bs, -1, self.no))
    
    # 如果是训练模式,返回x就行。如果不是则返回拼接结果  预测框坐标,object,class
    return x if self.training else (torch.cat(z, 1), x)
 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
YOLOv5的代码中包含了许多辅助模块和函数,用于进行物体检测和识别的相关任务。其中,代码会遍历每个物体,并将其类别和数量添加到字符串变量"s"中。具体来说,代码会计算当前类别下检测到的物体数量"n",然后根据数量和类别名字构建一段字符串,并将其添加到变量"s"中。代码中的"names"变量包含了数据集中所有类别的名称。\[1\] 为了实现物体检测和识别的任务,代码导入了YOLOv5的许多辅助模块。这些模块包括了一些通用的函数和类,如图像的处理、非极大值抑制等等。此外,还有一些用于加载图像或视频帧,并进行预处理的类,以便进行物体检测或识别。还有一些常用的工具函数,如检查文件是否存在、检查图像大小是否符合要求、打印命令行参数等等。此外,还有一些与PyTorch有关的工具函数,如选择设备、同步时间等等。\[2\] 在代码中,使用了一个循环来遍历检测结果列表中的每个物体,并对每个物体进行处理。循环中的变量"i"是一个索引变量,表示当前正在处理第几个物体,而变量"det"则表示当前物体的检测结果。循环体中的第一行代码 "seen += 1" 用于增加一个计数器,记录已处理的物体数量。\[3\] #### 引用[.reference_title] - *1* *2* *3* [YOLOv5中detect.py代码解读](https://blog.csdn.net/sinat_41942180/article/details/129280379)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值