【深度学习】【YOLACT】代码解读一

最新推荐文章于 2024-06-04 11:41:03 发布

Hanawh

最新推荐文章于 2024-06-04 11:41:03 发布

阅读量4.9k

点赞数 5

分类专栏：深度学习文章标签：深度学习

本文链接：https://blog.csdn.net/qq_36530992/article/details/104400594

版权

本文详细介绍了YOLACT深度学习模型的代码运行流程，包括数据集配置、验证过程的三种评估方法和训练步骤。在验证阶段，文章讨论了如何使用自定义评估函数以及设置分数阈值。此外，还探讨了模型的网络架构，特别是在单GPU环境下FPN模块的实现细节。

摘要由CSDN通过智能技术生成

代码运行

根据github所给指导一步一步进行，如果曾经下载好coco数据集，在data/config.py108行以下修改数据集的目录，并且在run_coco_eval.py16行修改验证集annotation文件的路径。

验证

有以下三种评估方式：
first

python eval.py --trained_model=weights/yolact_base_54_800000.pth

在这里插入图片描述
以上命令不使用coco数据集自带的模型评估COCOEval，而是使用自己定义的评估函数。
second

python eval.py --trained_model=weights/yolact_base_54_800000.pth --output_coco_json
python run_coco_eval.py

首先通过第一条命令生成’./results/bbox_detections.json’ and ‘./results/mask_detections.json’ 两个文件，第一个文件保存的是网络输出的预测框（坐标、类别及分数），然后通过第二条命令利用COCOEval来评估模型，可以看出和第一条命令的评估结果相差无几。
在这里插入图片描述
third

python eval.py --trained_model=weights/yolact_base_54_800000.pth --score_threshold=0.15 --top_k=15 --display

上述命令可以自定义分数阈值，凡是低于该阈值的都会被过滤，其次也可以选取前多少个作为要评估的输出。

处理图片

# 处理指定图片，通过plt显示结果
python eval.py --trained_model=weights/yolact_base_54_800000.pth --score_threshold=0.15 --top_k=15 --image=my_image.png

# 处理一张图片，结果存入另一张照片
python eval.py --trained_model=weights/yolact_base_54_800000.pth --score_threshold=0.15 --top_k=15 --image=input_image.png:output_image.png

#处理一个文件夹中所有图片
python eval.py --trained_model=weights/yolact_base_54_800000.pth --score_threshold=0.15 --top_k=15 --images=path/to/input/folder:path/to/output/folder

在这里插入图片描述

训练

根据指导下载好权重并放到weights/文件夹下。

# 默认batchsize是8，resnet101_backbone
python train.py --config=yolact_base_config

在这里插入图片描述

代码解读

网络架构

<bound method Module.named_parameters of Yolact(
  (backbone): ResNetBackbone(
    (layers): ModuleList(
      (0): Sequential( # C2
        (0): Bottleneck(
          (conv1): Conv2d(64, 64, kernel_size=(1, 1), stride=(1, 1), bias=False)
          (bn1): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
          (conv2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
          (bn2): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
          (conv3): Conv2d(64, 256, kernel_size=(1, 1), stride=(1, 1), bias=False)
          (bn3): BatchNorm2d(256, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
          (relu): ReLU(inplace)
          (downsample): Sequential(
            (0): Conv2d(64, 256, kernel_size=(1, 1), stride=(1, 1), bias=False)
            (1): BatchNorm2d(256, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
          )
        )
        (1): Bottleneck(
          (conv1): Conv2d(256, 64, kernel_size=(1, 1), stride=(1, 1), bias=False)
          (bn1): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
          (conv2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
          (bn2): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
          (conv3): Conv2d(64, 256, kernel_size=(1, 1), stride=(1, 1), bias=False)
          (bn3): BatchNorm2d(256, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
          (relu): ReLU(inplace)
        )
        (2): Bottleneck(
          (conv1): Conv2d(256, 64, kernel_size=(1, 1), stride=(1, 1), bias=False)
          (bn1): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
          (conv2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
          (bn2): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
          (conv3): Conv2d(64, 256, kernel_size=(1, 1), stride=(1, 1), bias=False)
          (bn3): BatchNorm2d(256, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
          (relu): ReLU(inplace)
        )
      )
      (1): Sequential( # C3
        (0): Bottleneck(
          (conv1): Conv2d(256, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
          (bn1): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
          (conv2): Conv2d(128, 128, kernel_size=(3, 3), stride=(2, 2), padding=(1, 1), bias=False)
          (bn2): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
          (conv3): Conv2d(128, 512, kernel_size=(1, 1), stride=(1, 1), bias=False)
          (bn3): BatchNorm2d(512, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
          (relu): ReLU(inplace)
          (downsample): Sequential(
            (0): Conv2d(256, 512, kernel_size=(1, 1), stride=(2, 2), bias=False)
            (1): BatchNorm2d(512, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
          )
        )
        (1): Bottleneck( 
          (conv1): Conv2d(512, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
          (bn1): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
          (conv2): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
          (bn2): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
          (conv3): Conv2d(128, 512, kernel_size=(1, 1), stride=(1, 1), bias=False)
          (bn3): BatchNorm2d(512, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
          (relu): ReLU(inplace)
        )
        (2): Bottleneck(
          (conv1): Conv2d(512, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
          (bn1): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
          (conv2): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
          (bn2): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
          (conv3): Conv2d(128, 512, kernel_size=(1, 1), stride=(1, 1), bias=False)
          (bn3): BatchNorm2d(512, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True

最低0.47元/天解锁文章

Hanawh

关注

5
点赞
踩
52

收藏

觉得还不错? 一键收藏
12
评论
【深度学习】【YOLACT】代码解读一

【YOLACT】代码解读一代码运行验证处理图片训练代码解读网络架构代码运行根据github所给指导一步一步进行，如果曾经下载好coco数据集，在data/config.py108行以下修改数据集的目录，并且在run_coco_eval.py16行修改验证集annotation文件的路径。验证有以下三种评估方式：firstpython eval.py --trained_model=we...
复制链接

扫一扫

专栏目录