目标检测简单笔记之YOLOV1

一. YOLOv1简介

  • 是个One stage的网络结构(端到端)
  • 作用:用于目标检测
  • 特点:比RCNN系列要快

二. 网络结构

YOLOv1把目标检测问题当作回归问题来处理,它的操作流程如下所述:

  1. 把原图分为SxS个区域(grid);
  2. 然后计算每个grid里的预测的bounding-box的(B * 5 + C)个值
  3. B * 5 + C意义:
    B表示预测的bounding-box个数
    5表示bounding-box的中心坐标,长宽,confidence值(IOU值),一共5个值
    C表示你要预测的每个类别的概率

在这里插入图片描述

论文中设置S=7, B=2, C=20,所以最后的输出为 7x7x(2x5 + 20) = 7 x 7 x 30

YOLOv1的网络结构如下图所示:
在这里插入图片描述

  • 输入shape:448x448;
  • 中间有48个卷积层,经过4个max-pooling之后,feature map的大小变为7x7,然后接两个全连接层,再reshape成输出的shape
  • 输出shape:7x7x30

三. Keras搭建模型

一些信息:
在这里插入图片描述

  • 这里的s-2应该是表示卷积层的stride=2
  • 模型经过pooling后,feature map的size才会变为原来的一半,经过卷积层后size是不变的,所以padding的方式是’same’
  • 最后一层是线性激活函数(就是啥都不做),其他层后面接leaky ReLU,斜率为0.1

在这里插入图片描述

  • 卷积层后面跟两个全连接层,一层输出4096维(如图上所示),另一层的维度应该是7x7x30 = 1470, 再reshape成输出的shape。

  • 在这里插入图片描述

  • 模型定义代码如下:

import keras
from keras.layers import *
from keras.models import *

model = Sequential()

# Block 1
model.add(Conv2D(64, (7, 7), strides=(2, 2), padding='same', input_shape=(448, 448, 3)))
model.add(LeakyReLU(alpha=0.1))
model.add(MaxPool2D(2, 2))

# Block 2
model.add(Conv2D(192, (3, 3), padding='same', ))
model.add(LeakyReLU(alpha=0.1))
model.add(MaxPooling2D(2, 2))
model.add(Dropout(0.5))

# Block 3
model.add(Conv2D(128, (1, 1), padding='same',))
model.add(LeakyReLU(alpha=0.1))
model.add(Conv2D(256, (3, 3), padding='same',))
model.add(LeakyReLU(alpha=0.1))
model.add(Conv2D(256, (1, 1), padding='same',))
model.add(LeakyReLU(alpha=0.1))
model.add(Conv2D(512, (3, 3), padding='same',))
model.add(LeakyReLU(alpha=0.1))
model.add(MaxPooling2D(2, 2))
model.add(Dropout(0.5))

#Block 4
model.add(Conv2D(256, (1, 1), padding='same', ))
model.add(LeakyReLU(alpha=0.1))
model.add(Conv2D(512, (3, 3), padding='same', ))
model.add(LeakyReLU(alpha=0.1))
model.add(Conv2D(256, (1, 1), padding='same', ))
model.add(LeakyReLU(alpha=0.1))
model.add(Conv2D(512, (3, 3), padding='same', ))
model.add(LeakyReLU(alpha=0.1))
model.add(Conv2D(256, (1, 1), padding='same', ))
model.add(LeakyReLU(alpha=0.1))
model.add(Conv2D(512, (3, 3), padding='same', ))
model.add(LeakyReLU(alpha=0.1))
model.add(Conv2D(256, (1, 1), padding='same', ))
model.add(LeakyReLU(alpha=0.1))
model.add(Conv2D(512, (3, 3), padding='same'))
model.add(LeakyReLU(alpha=0.1))
model.add(Conv2D(512, (1, 1), padding='same'))
model.add(LeakyReLU(alpha=0.1))
model.add(Conv2D(1024, (3, 3), padding='same'))
model.add(LeakyReLU(alpha=0.1))
model.add(MaxPooling2D(2, 2))
model.add(Dropout(0.5))

#Block 5
model.add(Conv2D(512, (1, 1), padding='same'))
model.add(LeakyReLU(alpha=0.1))
model.add(Conv2D(1024, (3, 3), padding='same'))
model.add(LeakyReLU(alpha=0.1))
model.add(Conv2D(512, (1, 1), padding='same'))
model.add(LeakyReLU(alpha=0.1))
model.add(Conv2D(1024, (3, 3), padding='same'))
model.add(LeakyReLU(alpha=0.1))
model.add(Conv2D(1024, (3, 3), padding='same'))
model.add(LeakyReLU(alpha=0.1))
model.add(Conv2D(1024, (3, 3), padding='same'))
model.add(LeakyReLU(alpha=0.1))
model.add(MaxPooling2D(2, 2))
model.add(Dropout(0.5))

#Block 6
model.add(Flatten())
model.add(Dense(4096))
model.add(LeakyReLU(alpha=0.1))
model.add(Dense(7*7*30))
model.add(LeakyReLU(alpha=0.1))
model.add(Reshape((7, 7, 30)))

结束。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值