模型量化
文章平均质量分 94
pogg_
YOLOv5 Lite作者
模型轻量化和压缩
双非硕士
展开
-
模型剪枝经典论文解读:《Learning Efficient Convolutional Networks through Network Slimming》
Learning Efficient Convolutional Networks through Network Slimming摘要:CNN在落地中的部署,很大程度上受到其高计算成本的限制。在本文中,作者提出一种新的CNN学习方案:1)减少模型大小;2) 减少模型运算内存的占用;3)在不影响准确性的同时,减少计算操作的次数。本文提出一种简单高效的方法,具体通过网络通道的稀疏化来实现的。该方法非常适用于CNN的结构,可将训练的开销降到最低,并且生成的模型不需要特定的软硬件进行加速,部署性能更高原创 2021-11-11 18:03:20 · 4695 阅读 · 0 评论 -
YOLOv5-Lite:如何让YOLO模型在cpu上加快?
SDKGraphicsCUDADriverToolsSoftwareVideo Codec SDK 9.0Tesla v10010.1NVIDIA Driver 440cmake&gccFFmpegVideo Codec SDK 9.0RTX 2080Ti10.2NVIDIA Driver 440cmake&gccFFmpeg原创 2021-10-13 23:42:45 · 6573 阅读 · 0 评论 -
YOLOv5-Lite:NCNN+Int8部署和量化,树莓派也可实时
本文版权属于GiantPandaCV,未经允许请勿转载前言: 还记得我在两个月前写的文章吗,关于yolov4-tiny+ncnn+int8量化的详细教程:https://zhuanlan.zhihu.com/p/372278785后来准备写yolov5+ncnn+int8量化的教程,却在yolov5的量化上遇到了麻烦,一方面是量化后速度更慢了,另一方面是精度下降严重,出现满屏都是检测框的现象,后来经过很多尝试,最终都以失败告终。再后来,还是决定换其他方式对yolov5进行量化,一是即使最小的yolo原创 2021-08-24 10:27:14 · 14436 阅读 · 32 评论 -
YOLOv5-Lite:更轻更快易于部署的YOLOv5
本文版权属于GiantPandaCV,未经允许请勿转载前言: 毕设的一部分,前段时间,在yolov5上进行一系列的消融实验,让他更轻(Flops更小,内存占用更低,参数更少),更快(加入shuffle channel,yolov5 head进行通道裁剪,在320的input_size至少能在树莓派4B上一秒推理10帧),更易部署(摘除Focus层和四次slice操作,让模型量化精度下降在可接受范围内)。一、消融实验结果比对IDModelInput_sizeFlopsParamsSi.原创 2021-08-19 11:07:02 · 18721 阅读 · 53 评论 -
dnn+yolo+flask推理(树莓派实时推流—内含YOLO全家桶系列)
DNN-Lightweight-Streaming这个资源库记录了在一些超轻量级网络上推送视频流的过程。一般的步骤是,opencv调用板子(比如树莓派)的摄像头,将检测到的实时视频传输到yolo-fastest、nanodet、ghostnet等超轻量级网络上,然后讲使用flask轻量级框架将处理后的视频帧推送到网络上,基本上可以保证实时性能。并且,这个仓库也记录一些侧端推理框架的性能,感兴趣的网友可以交流。仓库链接:https://github.com/pengtougu/DNN-Lightweig原创 2021-05-08 17:53:59 · 4307 阅读 · 1 评论 -
从零开始学人脸检测之Retinaface篇(内含魔改版GhostNet+mbv2)
前言Retinaface是Insightface团队在2019年提出的新人脸检测模型,该模型在 WiderFace 数据集上刷新了AP。源代码开源于insightface,原模型使用mxnet框架进行搭建,目前社区也有其他框架复现的版本,最让人熟知的莫过于pytorch版的retinaface。Retinaface是基于检测网络RetinaNet的改进版(没错,和centerface基于centernet类似),添加了SSH网络的三层级联检测模块,提升检测精度。作者提供了两种网络的复现版本(mobilen原创 2021-06-13 00:35:51 · 9011 阅读 · 10 评论 -
小白教程:树莓派3B+onnxruntime+scrfd+flask实现公网人脸检测系统
前情提要;最近出了一个新的人脸检测框架scrfd,scrfd的论文在5月10日挂在了阿凯上,感兴趣的同学们可以去看一看https://arxiv.org/abs/2105.04714新出的scrfd旨在实现模型效能的极致均衡:(Extensive experiments conducted on WIDER FACE demonstrate the state-of-the-art efficiency-accuracy trade-off for the proposed \scrfd family.原创 2021-06-06 16:21:57 · 4658 阅读 · 4 评论 -
NCNN+Int8+YOLOv4量化模型和实时推理
BatchCropCorrosionBackground segmentationinput_sizeRun time@(per sample)@Accuracy100√√6402.9s89.17500√√6402.8s89.741000√√6402.4s90.112000√√6402.3s90.13点裁消融Background segmentationinput_sizeRun time...原创 2021-05-15 22:59:51 · 5206 阅读 · 17 评论