yolo如何降低loss_探索 YOLO v3 实现细节 - 第 1 篇 训练

本文深入探讨了YOLO v3物体检测算法的实现细节,特别是在训练过程中的参数设定。介绍了数据集、预训练模型、anchor box、图片输入尺寸等关键参数,并详细阐述了模型创建、样本数量计算、损失函数设计以及训练过程,包括两个阶段的训练策略。此外,还提到了K-Means聚类算法在确定anchor box中的应用和EarlyStopping回调函数在防止过拟合中的作用。
摘要由CSDN通过智能技术生成

探索 YOLO v3 实现细节 - 第 1 篇 训练

YOLO, 即 You Only Look Once(你只看一次)的缩写, 是一个基于卷积神经网络 (CNN) 的物体检测算法. 而 YOLO v3 https://pjreddie.com/media/files/papers/YOLOv3.pdf 是 YOLO 的第 3 个版本(即 YOLO https://arxiv.org/abs/1506.02640 ,YOLO 9000 https://arxiv.org/abs/1612.08242 ,YOLO v3 https://arxiv.org/abs/1804.02767 ), 检测效果, 更准更强.

YOLO 是一句美国的俗语, You Only Live Once, 人生苦短, 及时行乐.

本文介绍如何实现 YOLO v3 算法, keras 框架. 这是第 1 篇, 训练. 当然还有第 2 篇, 至第 n 篇, 这是一个完整版 :)

本文的源码 https://github.com/SpikeKing/keras-yolo3-detection :https://github.com/SpikeKing/keras-yolo3-detection

1. 参数

模型的训练参数, 5 个参数:

(1) 已标注框的图片数据集, 格式如下:

图片的位置 框的 4 个坐标和 1 个类别 ID(xmin,ymin,xmax,ymax,label_id) ...

dataset/image.jpg 788,351,832,426,0 805,208,855,270,0

复制代码

(2) 标注框类别的汇总, 即数据集所标注物体的全部类别列表, 如下:aeroplane

bicycle

bird

...

复制代码

(3) 预训练模型, 用于迁移学习 (Transfer Learning) 中的微调(Fine Tune), 可选 YOLO v3 已训练完成的 COCO 模型权重, 即:

pretrained_path = 'model_data/yolo_weights.h5'

复制代码

(4) 预测特征图 (Prediction Feature Map) 的 anchor 框 (anchor box) 集合:

3 个尺度 (scale) 的特征图, 每个特征图 3 个 anchor 框, 共 9 个框, 从小到大排列;

1~3 是大尺度 (52x52) 特征图所使用的, 4~6 是中尺度(26x26),7~9 是小尺度(13x13);

大尺度特征图检测小物体, 小尺度检测大物体;

9 个 anchor 来源于边界框 (Bounding Box) 的 K-Means 聚类.

其中, COCO 的 anchors, 如下:

10,13, 16,30, 33,23, 30,61, 62,45, 59,119, 116,90, 156,198, 373,326

复制代码

(5) 图片输入尺寸, 默认为 416x416.

图片尺寸满足 32 的倍数, 在 DarkNet 网络中, 含有 5 次步长为 2 的降采样卷积(32=2^5). 降采样卷积的实现如下:

x = DarknetConv2D_BN_Leaky(num_filters, (3, 3), strides=(2, 2))(x)

复制代码

在最底层时, 特征图尺寸需要满足为奇数, 如 13, 以保证中心点落在唯一框中. 如果为偶数时, 则中心点落在中心的 4 个框中, 导致歧义.

2. 创建模型

创建 YOLOv3 的网络模型, 输入:

input_shape: 图片尺寸;

anchors:9 个

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值