本次的YOLO v3实战是基于DataFountain的一个比赛:智能盘点—钢筋数量AI识别,baseline model就选用上次讲解YOLO v3理论
用了大概一周的时间改进了一下,第二部分如下:CristianoC:YOLO v3实战之钢筋智能识别改进方案分享(二)zhuanlan.zhihu.com
对YOLO v3还不了解的读者可以先阅读一下理论部分:CristianoC:目标检测之YOLO v1zhuanlan.zhihu.comCristianoC:目标检测之YOLO v2zhuanlan.zhihu.comCristianoC:目标检测之YOLO v3(附代码详细解析)zhuanlan.zhihu.com
收藏数是点赞数的4倍了,欢迎大家给笔者点个赞当做给笔者创作的动力~
目录题目重述
数据准备
修改相关配置路径
开始训练
测试结果
题目重述
题目背景在工地现场,对于进场的钢筋车,验收人员需要对车上的钢筋进行现场人工点根,确认数量后钢筋车才能完成进场卸货。目前现场采用人工计数的方式,如图1-1中所示:图1-1 钢筋点跟现场场景上述过程繁琐、消耗人力且速度很慢(一般一车钢筋需要半小时,一次进场盘点需数个小时)。针对上述问题,希望通过手机拍照->目标检测计数->人工修改少量误检的方式(如图1-2)智能、高效的完成此任务:图1-2 理想工作场景
主要难点精度要求高。钢筋本身价格较昂贵,且在实际使用中数量很大,误检和漏检都需要人工在大量的标记点中找出,所以需要精度非常高才能保证验收人员的使用体验。需要专门针对此密集目标的检测算法进行优化,另外,还需要处理拍摄角度、光线不完全受控,钢筋存在长短不齐、可能存在遮挡等情况。
钢筋尺寸不一。钢筋的直径变化范围较大(12-32中间很多种类)且截面形状不规则、颜色不一,拍摄的角度、距离也不完全受控,这也导致传统算法在实际使用的过程中效果很难稳定。
边界难以区分。一辆钢筋车一次会运输很多捆钢筋(如图1-3),如果直接全部处理会存在边缘角度差、遮挡等问题效果不好,目前在用单捆处理+最后合计的流程,这样的处理过程就会需要对捆间进行分割或者对最终结果进行去重,难度较大。图1-3 钢筋进场场景
任务赛题基于广联达公司提供的钢筋进场现场的图片和标注,希望参赛者综合运用计算机视觉和机器学习/深度学习等技术,实现拍照即可完成钢筋点根任务,大幅度提升建筑行