文献阅读—Apple detection during different growth stages in orchards using the improved YOLO-V3 model

期刊:Computers and Electronics in Agriculture(SCI 2区)
发表时间:2019.02

1.作者想要解决问题

  • 识别不同成熟状态的苹果
  • 解决果实重叠,枝干树叶遮挡的问题
  • 减低在真实果园下光照不稳定及复杂背景带来的影响

2.改进网络设计

3.相关评价指标

  • P-R 曲线
    在这里插入图片描述
  • F1、IoU、time
    在这里插入图片描述
    分析上表可知:
  1. YOLOV3-dense 网络即使面对有 RPN 的 two-stage 网络 Faster R-CNN,F1指标依旧高出 1.6 个百分点
  2. YOLOV3-dense 网络嵌入 dense 结构后,提高了低分辨率下的特征提取以及特征复用,对于 bounding boxes 检查更加准确,IoU指标比 Faster R-CNN 高出 2.3 个百分点
  3. 由于嵌入 dense 结构,相较 YOLOv3 网络,YOLOV3-dense 网络结构更加复杂,参数多,因此检测时间慢了 0.008 s,相差是毫秒级,可不计

4.图像预处理

  • image colour
    采用世界灰度算法,将 RGB 三个通道的像素值根据平均灰度进行调制,该方法可有效消除图像中光照的影响,还原原始图像。这种算法简单快速,但是当图像场景颜色并不丰富时,尤其出现大块单色物体时,该算法常会失效
  • image brightness
    随机从 lmin ~ lmax 选取三个值,用于调整原始图像的亮度,并将调整后的图像加入到训练集,论文中 lmin 和 lmax 分别选取 0.6 和 1.4 。
  • image rotation
    将原始图像分别旋转 90°、180°、270°以及镜像
  • image definition
  • 将 augmented by colour, brightness, androtation 的图像进行随机模糊处理,提高网络的鲁棒性。

论文中将480张原始图片扩增至4800张:
480 (original) + 480 (colour) + 480 x 3 (bringtness) + 480 x 4 (rotation) + 480 (definition) = 4800

5.网络结构
在这里插入图片描述

  • 论文中将 32 x 32 和 16 x 16 的卷积层用 dense 结构替换
  • 关于dense结构详解,可以去看我的另一篇博文SelfLearning1_DenseNet

6.文章的不足纯个人意见

  • 原始数据集过少,单纯依靠数据增强来生成绝大多数的训练集,可能会使得训练网络时,提取的特征过于单一
  • 文章并没有针对作者提出的果实重叠及遮挡问题给予专门的 trick 设计,仅仅依靠网络结构的改进不足以支撑
  • 如果说解决识别不同生长阶段的苹果问题仅依靠输入的训练集包含各个阶段的生长状态,我并不认为是创新
  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值