期刊:Computers and Electronics in Agriculture(SCI 2区)
发表时间:2019.02
1.作者想要解决问题
- 识别不同成熟状态的苹果
- 解决果实重叠,枝干树叶遮挡的问题
- 减低在真实果园下光照不稳定及复杂背景带来的影响
2.改进网络设计
- 嵌入 Dense 结构(与未成熟芒果的改进 YOLOv2 识别方法这篇文章不同),作者将其命名为 YOLOV3-dense
3.相关评价指标
- P-R 曲线
- F1、IoU、time
分析上表可知:
- YOLOV3-dense 网络即使面对有 RPN 的 two-stage 网络 Faster R-CNN,F1指标依旧高出 1.6 个百分点
- YOLOV3-dense 网络嵌入 dense 结构后,提高了低分辨率下的特征提取以及特征复用,对于 bounding boxes 检查更加准确,IoU指标比 Faster R-CNN 高出 2.3 个百分点
- 由于嵌入 dense 结构,相较 YOLOv3 网络,YOLOV3-dense 网络结构更加复杂,参数多,因此检测时间慢了 0.008 s,相差是毫秒级,可不计
4.图像预处理
- image colour
采用世界灰度算法,将 RGB 三个通道的像素值根据平均灰度进行调制,该方法可有效消除图像中光照的影响,还原原始图像。这种算法简单快速,但是当图像场景颜色并不丰富时,尤其出现大块单色物体时,该算法常会失效。 - image brightness
随机从 lmin ~ lmax 选取三个值,用于调整原始图像的亮度,并将调整后的图像加入到训练集,论文中 lmin 和 lmax 分别选取 0.6 和 1.4 。 - image rotation
将原始图像分别旋转 90°、180°、270°以及镜像。 - image definition
- 将 augmented by colour, brightness, androtation 的图像进行随机模糊处理,提高网络的鲁棒性。
论文中将480张原始图片扩增至4800张:
480 (original) + 480 (colour) + 480 x 3 (bringtness) + 480 x 4 (rotation) + 480 (definition) = 4800
5.网络结构
- 论文中将 32 x 32 和 16 x 16 的卷积层用 dense 结构替换
- 关于dense结构详解,可以去看我的另一篇博文SelfLearning1_DenseNet
6.文章的不足(纯个人意见)
- 原始数据集过少,单纯依靠数据增强来生成绝大多数的训练集,可能会使得训练网络时,提取的特征过于单一
- 文章并没有针对作者提出的果实重叠及遮挡问题给予专门的 trick 设计,仅仅依靠网络结构的改进不足以支撑
- 如果说解决识别不同生长阶段的苹果问题仅依靠输入的训练集包含各个阶段的生长状态,我并不认为是创新