YOLOv5它来了!YOLOv4发布不到50天,它带着推理速度140帧/秒、性能提升2倍来了

点击上方“3D视觉工坊”,选择“星标”

干货第一时间送达

贾浩楠 发自 凹非寺

转自 | 量子位 

YOLOv4还没有退热,YOLOv5已经发布!

6月9日,Ultralytics公司开源了YOLOv5,离上一次YOLOv4发布不到50天。而且这一次的YOLOv5是完全基于PyTorch实现的!

在我们还对YOLOv4的各种骚操作、丰富的实验对比惊叹不已时,YOLOv5又带来了更强实时目标检测技术。

按照官方给出的数目,现版本的YOLOv5每个图像的推理时间最快0.007秒,即每秒140帧(FPS),但YOLOv5的权重文件大小只有YOLOv4的1/9

接下来一起了解一下最新的YOLOv5吧。

   更快更小巧的YOLOv5

老规矩,先来介绍一下安装过程。

安装YOLOv5通过下方代码实现:

$ pip install -U -r requirements.txt

要求Python3.7以上版本,PyTorch1.5以上。

YOLOv5的4组不同权重在COCO2017数据集上的结果如下:

所有模型均采用默认配置与超参数训练了300epoch,且未添加自动扩增技术。

可以看到,它超过了大部分的目标检测器,同时具有超快的速度。

APtest指的是COCO-test-dev2017上的结果,其他AP表示val2017的精度。所有指标均为单模型、单尺度、为进行任何集成与TTA。可以通过如下命令进行重现上述指标:

python test.py —img-size 736 —conf_thres 0.001

延迟是在V100 GPU上对5000个COCO-val2017中的数据进行测试的结果,包含数据预处理、模型推理、后处理以及NMS。平均NMS的时间为1.6ms/image。

上述指标可以通过如下命令复现:

python test.py —img-size 640 —conf_thres 0.1 —batch-size 16

YOLOv5在单一V-100 GPU的情况下,COCO 2017数据集上的训练时间分别为:

YOLOv5 s

YOLOv5 m

YOLOv5 l

YOLOv5 x

2天

4天

6天

8天

可以通过以下代码开始训练:

$ python train.py —data coco.yaml —cfg YOLOv5s.yaml —weights ‘’ —batch-size 16

不同权重YOLOv5的对比

YOLOv5在中国国内街景监控上的实测,包含了YOLOv5 s/m/l/x四种不同权重:

测试视频来自B站@才疏学浅的小白

用户的测试实例并没有给出与前代YOLOv4的对比,但官方给出了数据说明。

YOLOv5速度比前代更快,在运行Tesla P100的YOLOv5 Colab笔记本中,每个图像的推理时间快至0.007秒,意味着每秒140帧(FPS)!相比之下,YOLOv4在转换为相同的Ultralytics PyTorch后达到了50帧 。

同时,在研究者对血细胞计数和检测(BCCD)数据集的测试中,经过100个epoch的训练,获得了大约0.895的平均精度(mAP),与EfficientDet和YOLOv4相当。

YOLOv5体积小,YOLOv5 s的权重文件为27MB。YOLOv4(Darknet架构)的权重文件为244MB。YOLOv5比YOLOv4小近90%。这意味着YOLOv5可以更轻松地部署到嵌入式设备。

此外,因为YOLOv5是在PyTorch中实现的,所以它受益于已建立的PyTorch生态系统;YOLOv5还可以轻松地编译为ONNX和CoreML,因此这也使得部署到移动设备的过程更加简单。

   大神没交棒,但YOLOv5还是来了

严格来讲,这次Ultralytics放出的YOLOv5,是YOLOv4的一个实现版本(性能有改进),只不过是完全用Pyotorch实现了。并且支持转ONNX以及CoreML等,方便用户在移动端部署。

所以也有网友叫它YOLOv4.5。

截止发稿,原YOLO项目官方(Darknet)也没有添加YOLOv5链接,所以,这个「YOLOv5」的名号,是Ultralytics团队自封的。

Ultralytics公司可能大家不熟悉,但提到他们公司的一个项目,很多人应该就知道了:基于PyTorch复现的YOLOv3。按目前github上star数来看,应该是最受欢迎的YOLOv3的PyTorch实现版本。

值得一提的是,Ultralytics公司的Glenn Jocher是mosaic数据增强方法的创建者,这种方法是改进后的YOLOv4中的重要技术。

Glenn Jocher就是这次YOLOv5项目的主要开发者。

尽管官方还没认可项目命名为”YOLOv5”这个名字,但它对上一版本性能的改善和提升十分显著,网友也对其开源的精神纷纷点赞,希望项目继续更新,造福更多的YOLO用户。

传送门

https://github.com/ultralytics/YOLOv5

作者系网易新闻·网易号“各有态度”签约作者

推荐阅读:

重磅!3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流等微信群,请扫描下面微信号加群,备注:”研究方向+学校/公司+昵称“,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进去相关微信群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的知识点汇总、入门进阶学习路线、最新paper分享、疑问解答四个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近1000+星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

 圈里有高质量教程资料、可答疑解惑、助你高效解决问题

  • 0
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值