深度学习
文章平均质量分 92
pogg_
YOLOv5 Lite作者
模型轻量化和压缩
双非硕士
展开
-
YOLOv7来临:论文解读附代码解析
官方版的YOLOv7相同体量下比YOLOv5精度更高,速度快120%(FPS),比 YOLOX 快180%(FPS),比 Dual-Swin-T 快1200%(FPS),比 ConvNext 快550%(FPS),比 SWIN-L快500%(FPS)。在5FPS到160FPS的范围内,无论是速度或是精度,YOLOv7都超过了目前已知的检测器,并且在GPU V100上进行测试, 精度为56.8% AP的模型可达到30 FPS(batch=1)以上的检测速率,与此同时,这是目前唯一一款在如此高精度下仍能超过3原创 2022-07-08 12:38:01 · 29318 阅读 · 18 评论 -
目标检测2020-2021
**【GiantPandaCV导语】**目标检测发展迅猛,新的sota网络层出不穷,本文盘点截止2021年12月,在coco test-dev上霸榜的近五年的,且知名度较广的目标检测网络。由于评分条例过多过杂,此处仅使用Box AP.50进行排序,未开源、使用额外数据集的暂不加入文章讨论中。1. Swin Transformer V2: Scaling Up Capacity and Resolutioncode:https://github.com/microsoft/Swin-Transformer原创 2022-04-10 15:28:37 · 4929 阅读 · 2 评论 -
CVPR2022 Oral:StreamYOLO-流感知实时检测器
前言: 自动驾驶技术要求在低延迟时间内得到反馈。过去的工作提出了信息流感知联合评价指标,用于评估算法的延迟和准确性。该论文并没有像以前的工作那样追求精度和速度之间的权衡,而是提出检测模型对于未来的预测是处理这个问题的关键。 我们建立了一个简单而有效的流媒体感知框架。它配备了 一种新的双流感知模块(DFP),其中包括动态流和静态流 来捕捉移动趋势和流预测的基本检测特征。此外,我们引 入了一个趋势感知损失(TAL),并结合了一个趋势因子, 为具有不同移动速度的物体生成自适应权重。我们的简单 方法在Argogrs原创 2022-04-09 21:50:03 · 2352 阅读 · 6 评论 -
工业部署二之PicoDet网络结构在YOLOv5-Lite上的复现
【GiantPandaCV导语】这篇博客仅对PicoDet的网络结构进行复现。PicoDet在一定程度上刷新了业界轻量级移动端模型的sota,这也是我比较感兴趣的地方。本文将PicoDet模型网络结构迁移到yolov5的平台,因为是anchor base的形式,在性能上与原生模型可能有一定的差异,以下是原生模型的性能指标。一、PicoDet介绍Picodet论文在11月放出,后面对模型结构进行了复现,但因为没有显卡,迟迟无法对复现后的模型进行效果检验(现在依旧没有显卡可以跑模型,遂放出代码),这个周末原创 2021-12-19 22:07:11 · 2039 阅读 · 5 评论 -
YOLOv5-Lite:Repvgg重参化对YOLO工业落地的实验和思考
这一次的实验主要借鉴repvgg重参化的思想,将原有的3×3conv替换成Repvgg Block,为原有的YOLO模型涨点。前言: 之前做了一次shufflenetv2与yolov5的组合,目的是为了适配arm系列芯片,让yolov5在端侧设备上也能达到实时。但在gpu或者npu方面也一直在尝试着实验,对此类实验的目的很明确,要求也不高,主要还是希望yolov5在保持原有精度的同时能够提速。实验这一次的模型主要还是借鉴repvgg重参化的思想,将原有的3×3conv替换成repvgg block,.原创 2021-09-18 20:16:12 · 6666 阅读 · 19 评论 -
YOLOv5-Lite:NCNN+Int8部署和量化,树莓派也可实时
本文版权属于GiantPandaCV,未经允许请勿转载前言: 还记得我在两个月前写的文章吗,关于yolov4-tiny+ncnn+int8量化的详细教程:https://zhuanlan.zhihu.com/p/372278785后来准备写yolov5+ncnn+int8量化的教程,却在yolov5的量化上遇到了麻烦,一方面是量化后速度更慢了,另一方面是精度下降严重,出现满屏都是检测框的现象,后来经过很多尝试,最终都以失败告终。再后来,还是决定换其他方式对yolov5进行量化,一是即使最小的yolo原创 2021-08-24 10:27:14 · 14436 阅读 · 32 评论 -
YOLOv5-Lite:更轻更快易于部署的YOLOv5
本文版权属于GiantPandaCV,未经允许请勿转载前言: 毕设的一部分,前段时间,在yolov5上进行一系列的消融实验,让他更轻(Flops更小,内存占用更低,参数更少),更快(加入shuffle channel,yolov5 head进行通道裁剪,在320的input_size至少能在树莓派4B上一秒推理10帧),更易部署(摘除Focus层和四次slice操作,让模型量化精度下降在可接受范围内)。一、消融实验结果比对IDModelInput_sizeFlopsParamsSi.原创 2021-08-19 11:07:02 · 18721 阅读 · 53 评论 -
从零开始学CV之二损失函数篇(4)
注:本篇博客大部分内容并非原创,而是本人将之前收藏的资料整理,并加以自己的愚解整合成到一起,方便回顾复习,所有参考资料均已注明出处,并已点赞加收藏~续:从零开始学CV之二损失函数篇(3)1.3 Sphereface该Sphereface最早提出于CVPR 2017的《SphereFace: Deep Hypersphere Embedding for Face Recognition》,其也称A-Softmax损失函数,论文链接:https://arxiv.org/abs/1704.08063作.原创 2021-06-30 18:06:19 · 780 阅读 · 1 评论 -
从零开始学CV之二损失函数篇(3)
注:本篇博客大部分内容并非原创,而是本人将之前收藏的资料整理,并加以自己的愚解整合成到一起,方便回顾复习,所有参考资料均已注明出处,并已点赞加收藏~前言: 上篇我们讲完了图像分类、目标检测常用的损失函数,这篇我们继续往下讲,主要讲的是人脸识别的损失函数。人脸识别算是CV落地最成熟的一个方向了,损失函数对于人脸模型来说实在是太重要了,常见的人脸识别框架facenet、insightface都会在论文里面花大篇幅去介绍它们的损失函数。那么这一章,我们按照softmax→Triplet Loss→Cent.原创 2021-06-30 17:47:32 · 713 阅读 · 0 评论 -
从零开始学CV之二损失函数篇(2)
注:本篇博客大部分内容并非原创,而是本人将之前收藏的资料整理,并加以自己的愚解整合成到一起,方便回顾复习,所有参考资料均已注明出处,并已点赞加收藏~前言: 续从零开始学CV之二损失函数篇(上)2.2.3 IoU Loss(Intersection-Over-Union,交并比函数)该方法由旷视提出,发表于2016 ACM,论文链接:https://arxiv.org/pdf/1608.01471.pdf通过4个坐标点独立回归Building boxes的缺点:(1)检测评价的方式是使用IoU,.原创 2021-06-30 17:30:03 · 364 阅读 · 1 评论 -
从零开始学CV之二损失函数篇(1)
注:本篇博客大部分内容并非原创,而是本人将之前收藏的资料整理,并加以自己的愚解整合成到一起,方便回顾复习,所有参考资料均已注明出处,并已点赞加收藏~前言: 在深度学习中,损失函数扮演着重要的角色。通过损失函数可以使模型达到收敛状态,减少模型预测值的误差。因此,不同的损失函数对模型的影响是也是有差异的(调参师的日常工作之一)。在这一篇章节,我们会讲解什么是损失函数,图像分类、目标检测、人脸识别分别有哪些常见的损失函数,具体的特点在哪~1. 什么是损失函数概括来说,损失函数(loss function).原创 2021-06-30 17:00:08 · 713 阅读 · 1 评论 -
从零开始学CV之一激活函数篇(Activation Function)
前言:相信很多接触过cv的同学都有去研究过激活函数,激活函数相对于一个神经元来说是非常重要的,一个好的激活函数可以让你的模型得到质的飞跃,那到底什么是激活函数?常见的激活函数有哪些?它们的优缺点是什么?1. 什么是激活函数?相信大家高中生物都有学过神经系统,其实神经网络借助了生物学对脑神经的研究成果,我们拿一个生物大脑的神经元打个比方~分叉凸起的部分是树突也叫突触,它用来接收外界传入的电信号,突触包围着的就是神经元,它把突触接收到的信号(多个电信号,类似多个inputs)整合成一个反馈信息。但是.原创 2021-06-30 16:28:32 · 1463 阅读 · 0 评论 -
从零开始学人脸检测之Retinaface篇(内含魔改版GhostNet+mbv2)
前言Retinaface是Insightface团队在2019年提出的新人脸检测模型,该模型在 WiderFace 数据集上刷新了AP。源代码开源于insightface,原模型使用mxnet框架进行搭建,目前社区也有其他框架复现的版本,最让人熟知的莫过于pytorch版的retinaface。Retinaface是基于检测网络RetinaNet的改进版(没错,和centerface基于centernet类似),添加了SSH网络的三层级联检测模块,提升检测精度。作者提供了两种网络的复现版本(mobilen原创 2021-06-13 00:35:51 · 9011 阅读 · 10 评论