Yolo-Fastest：超超超快的开源ARM实时目标检测算法

最新推荐文章于 2024-07-30 14:11:00 发布

weixin_40245131

最新推荐文章于 2024-07-30 14:11:00 发布

阅读量766

点赞数

分类专栏： YOLO 文章标签：目标检测计算机视觉

原文链接：https://zhuanlan.zhihu.com/p/234506503

版权

YOLO 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

转：https://zhuanlan.zhihu.com/p/234506503

Yolo-Fastest，顾名思义，应该是现在已知开源最快的最轻量的改进版yolo通用目标检测算法（貌似也是现在通用目标检测算法中最快最轻量的），其实初衷就是打破算力的瓶颈，能在更多的低成本的边缘端设备实时运行目标检测算法，例如树莓派3b，4核A53 1.2Ghz，在最新基于NCNN推理框架开启BF16s，320x320图像单次推理时间在60ms～，而在性能更加强劲的树莓派4b，单次推理33ms，达到了30fps的全实时。而相比较下应用最广泛的轻量化目标检测算法MobileNet-SSD要在树莓派3b跑200ms左右，Yolo-Fastest速度整整要快3倍+，而且模型才只有1.3MB，而MobileNet-SSD模型达到23.2MB，Yolo-Fastest整整比它小了20倍，当然这也是有代价的，在Pascal voc上的map，MobileNet-SSD 是72.7，Yolo-Fastest是61.2，带来了接近10个点的精度损失，当然孰轻孰重，大家都有各自的想法。其实大家一般的检测任务本身不会像VOC那样检测20类那么多那么复杂，一般都是几类甚至单类检测，那么这样对于模型本身学习能力要求没那么高，因为本身类别越多样本不平衡的问题越大，越影响模型本身的性能。其实这个问题可以参考我的yoloface-500kb，一个只有400kb大小的人脸检测模型，这个本身就是个轻量化单类目标检测模型。下图是树莓派3b 基于Ncnn的常见模型的Benchmark

其实，我还有个xl版本啊哈哈哈，精度更高当然模型更大速度当然…更慢啊xl就不多讲了，肯定树莓派3b没法实时，嘻嘻，但是这边有个基于麒麟990的NCNN的速度基准

啥，精度还不够，看来直接祭出我的MobileNetv2-yolov3-lite，VOC 73.2%的mAP，37.4% AP05 COCO，只有8MB，1.8Bflops，比mb-ssd系列的算法动不动10几20几MB的模型大小轻量很多，精度也高一些，但是lite只是证明yolo比mb-ssd系列更有优势，真正有意义实时的是fastest-xl以及fastest，哈哈，在放一张对比图