目标检测
文章平均质量分 93
pogg_
YOLOv5 Lite作者
模型轻量化和压缩
双非硕士
展开
-
YOLOv7-Pose尝鲜,基于YOLOv7的关键点模型测评
目前人体姿态估计总体分为Top-down和Bottom-up两种,与目标检测不同,无论是基于热力图或是基于检测器处理的关键点检测算法,都较为依赖计算资源,推理耗时略长,今年出现了以YOLO为基线的关键点检测器。玩过目标检测的童鞋都知道YOLO以及各种变种目前算是工业落地较多的一类检测器,其简单的设计思想,长期活跃的社区生态,使其始终占据着较高的话题度。...原创 2022-07-31 23:47:42 · 5812 阅读 · 23 评论 -
YOLOv7来临:论文解读附代码解析
官方版的YOLOv7相同体量下比YOLOv5精度更高,速度快120%(FPS),比 YOLOX 快180%(FPS),比 Dual-Swin-T 快1200%(FPS),比 ConvNext 快550%(FPS),比 SWIN-L快500%(FPS)。在5FPS到160FPS的范围内,无论是速度或是精度,YOLOv7都超过了目前已知的检测器,并且在GPU V100上进行测试, 精度为56.8% AP的模型可达到30 FPS(batch=1)以上的检测速率,与此同时,这是目前唯一一款在如此高精度下仍能超过3原创 2022-07-08 12:38:01 · 28738 阅读 · 18 评论 -
目标检测2020-2021
**【GiantPandaCV导语】**目标检测发展迅猛,新的sota网络层出不穷,本文盘点截止2021年12月,在coco test-dev上霸榜的近五年的,且知名度较广的目标检测网络。由于评分条例过多过杂,此处仅使用Box AP.50进行排序,未开源、使用额外数据集的暂不加入文章讨论中。1. Swin Transformer V2: Scaling Up Capacity and Resolutioncode:https://github.com/microsoft/Swin-Transformer原创 2022-04-10 15:28:37 · 4921 阅读 · 2 评论 -
CVPR2022 Oral:StreamYOLO-流感知实时检测器
前言: 自动驾驶技术要求在低延迟时间内得到反馈。过去的工作提出了信息流感知联合评价指标,用于评估算法的延迟和准确性。该论文并没有像以前的工作那样追求精度和速度之间的权衡,而是提出检测模型对于未来的预测是处理这个问题的关键。 我们建立了一个简单而有效的流媒体感知框架。它配备了 一种新的双流感知模块(DFP),其中包括动态流和静态流 来捕捉移动趋势和流预测的基本检测特征。此外,我们引 入了一个趋势感知损失(TAL),并结合了一个趋势因子, 为具有不同移动速度的物体生成自适应权重。我们的简单 方法在Argogrs原创 2022-04-09 21:50:03 · 2326 阅读 · 6 评论 -
检测器backbone和neck哪个更重要,达摩院新作有不一样的答案
论文名称《GIRAFFEDET:一种heavy-neck的物体检测新范式》论文地址:https://arxiv.org/pdf/2202.04256.pdf摘要在传统的目标检测框架中,模型从骨干提取深层潜在特征,然后由颈部模块融合这些潜在特征,捕获不同尺度的信息。由于目标检测的对分辨率的要求比图像识别的要大得多,因此骨干网的计算成本往往占据了大部分推理成本。这种重骨干的设计范式在传统图像识别往目标检测发展时遗留了下来,但这种范式并不是针对目标检测的端到端优化设计。在这项工作中,我们证明了这种范式确实只原创 2022-02-11 23:23:33 · 1392 阅读 · 0 评论 -
工业部署二之PicoDet网络结构在YOLOv5-Lite上的复现
【GiantPandaCV导语】这篇博客仅对PicoDet的网络结构进行复现。PicoDet在一定程度上刷新了业界轻量级移动端模型的sota,这也是我比较感兴趣的地方。本文将PicoDet模型网络结构迁移到yolov5的平台,因为是anchor base的形式,在性能上与原生模型可能有一定的差异,以下是原生模型的性能指标。一、PicoDet介绍Picodet论文在11月放出,后面对模型结构进行了复现,但因为没有显卡,迟迟无法对复现后的模型进行效果检验(现在依旧没有显卡可以跑模型,遂放出代码),这个周末原创 2021-12-19 22:07:11 · 2029 阅读 · 5 评论 -
模型剪枝经典论文解读:《Learning Efficient Convolutional Networks through Network Slimming》
Learning Efficient Convolutional Networks through Network Slimming摘要:CNN在落地中的部署,很大程度上受到其高计算成本的限制。在本文中,作者提出一种新的CNN学习方案:1)减少模型大小;2) 减少模型运算内存的占用;3)在不影响准确性的同时,减少计算操作的次数。本文提出一种简单高效的方法,具体通过网络通道的稀疏化来实现的。该方法非常适用于CNN的结构,可将训练的开销降到最低,并且生成的模型不需要特定的软硬件进行加速,部署性能更高原创 2021-11-11 18:03:20 · 4634 阅读 · 0 评论 -
YOLOv5-Lite:如何让YOLO模型在cpu上加快?
SDKGraphicsCUDADriverToolsSoftwareVideo Codec SDK 9.0Tesla v10010.1NVIDIA Driver 440cmake&gccFFmpegVideo Codec SDK 9.0RTX 2080Ti10.2NVIDIA Driver 440cmake&gccFFmpeg原创 2021-10-13 23:42:45 · 6458 阅读 · 0 评论 -
YOLOv5-Lite:Repvgg重参化对YOLO工业落地的实验和思考
这一次的实验主要借鉴repvgg重参化的思想,将原有的3×3conv替换成Repvgg Block,为原有的YOLO模型涨点。前言: 之前做了一次shufflenetv2与yolov5的组合,目的是为了适配arm系列芯片,让yolov5在端侧设备上也能达到实时。但在gpu或者npu方面也一直在尝试着实验,对此类实验的目的很明确,要求也不高,主要还是希望yolov5在保持原有精度的同时能够提速。实验这一次的模型主要还是借鉴repvgg重参化的思想,将原有的3×3conv替换成repvgg block,.原创 2021-09-18 20:16:12 · 6630 阅读 · 19 评论 -
YOLOv5-Lite:NCNN+Int8部署和量化,树莓派也可实时
本文版权属于GiantPandaCV,未经允许请勿转载前言: 还记得我在两个月前写的文章吗,关于yolov4-tiny+ncnn+int8量化的详细教程:https://zhuanlan.zhihu.com/p/372278785后来准备写yolov5+ncnn+int8量化的教程,却在yolov5的量化上遇到了麻烦,一方面是量化后速度更慢了,另一方面是精度下降严重,出现满屏都是检测框的现象,后来经过很多尝试,最终都以失败告终。再后来,还是决定换其他方式对yolov5进行量化,一是即使最小的yolo原创 2021-08-24 10:27:14 · 14151 阅读 · 32 评论 -
YOLOv5-Lite:更轻更快易于部署的YOLOv5
本文版权属于GiantPandaCV,未经允许请勿转载前言: 毕设的一部分,前段时间,在yolov5上进行一系列的消融实验,让他更轻(Flops更小,内存占用更低,参数更少),更快(加入shuffle channel,yolov5 head进行通道裁剪,在320的input_size至少能在树莓派4B上一秒推理10帧),更易部署(摘除Focus层和四次slice操作,让模型量化精度下降在可接受范围内)。一、消融实验结果比对IDModelInput_sizeFlopsParamsSi.原创 2021-08-19 11:07:02 · 18467 阅读 · 53 评论 -
从零开始学人脸检测之Retinaface篇(内含魔改版GhostNet+mbv2)
前言Retinaface是Insightface团队在2019年提出的新人脸检测模型,该模型在 WiderFace 数据集上刷新了AP。源代码开源于insightface,原模型使用mxnet框架进行搭建,目前社区也有其他框架复现的版本,最让人熟知的莫过于pytorch版的retinaface。Retinaface是基于检测网络RetinaNet的改进版(没错,和centerface基于centernet类似),添加了SSH网络的三层级联检测模块,提升检测精度。作者提供了两种网络的复现版本(mobilen原创 2021-06-13 00:35:51 · 8921 阅读 · 10 评论 -
小白教程:树莓派3B+onnxruntime+scrfd+flask实现公网人脸检测系统
前情提要;最近出了一个新的人脸检测框架scrfd,scrfd的论文在5月10日挂在了阿凯上,感兴趣的同学们可以去看一看https://arxiv.org/abs/2105.04714新出的scrfd旨在实现模型效能的极致均衡:(Extensive experiments conducted on WIDER FACE demonstrate the state-of-the-art efficiency-accuracy trade-off for the proposed \scrfd family.原创 2021-06-06 16:21:57 · 4636 阅读 · 4 评论 -
NCNN+Int8+YOLOv4量化模型和实时推理
BatchCropCorrosionBackground segmentationinput_sizeRun time@(per sample)@Accuracy100√√6402.9s89.17500√√6402.8s89.741000√√6402.4s90.112000√√6402.3s90.13点裁消融Background segmentationinput_sizeRun time...原创 2021-05-15 22:59:51 · 5185 阅读 · 17 评论 -
dnn+yolo+flask推理(树莓派实时推流—内含YOLO全家桶系列)
DNN-Lightweight-Streaming这个资源库记录了在一些超轻量级网络上推送视频流的过程。一般的步骤是,opencv调用板子(比如树莓派)的摄像头,将检测到的实时视频传输到yolo-fastest、nanodet、ghostnet等超轻量级网络上,然后讲使用flask轻量级框架将处理后的视频帧推送到网络上,基本上可以保证实时性能。并且,这个仓库也记录一些侧端推理框架的性能,感兴趣的网友可以交流。仓库链接:https://github.com/pengtougu/DNN-Lightweig原创 2021-05-08 17:53:59 · 4288 阅读 · 1 评论 -
Yolo-fastest+dnn+flask实现移动端推流&拉流并在web显示
转载请注明出处!转载请注明出处!转载请注明出处!已经两三点了,太困了,直接github上的readme复制过来,周末有点无聊,做了一个推拉流的demo,共四个功能:①图片推理②视频推理和保存③摄像头本地推理(不加保存了,有点费内存)④移动端(树莓派,或其他开发板)调用摄像头并对流帧进行推理,通过flask推流到局域网,局域网下的其他设备拉流并显示在web页面上代码基本不用改,down下来即可运行,已在window&mac&linux三种平台上测试过,代码通用。推拉流那个,请保原创 2021-04-18 01:51:53 · 3450 阅读 · 13 评论 -
CNN经典之VGG网络+PyTorch复现
一、前情说明:写在前面的话本系列博客在于汇总CSDN的精华帖,类似自用笔记,方便以后的复习回顾,博文中的引用都注明出处,并点赞收藏原博主。博客大致分为两部分,第一部是转载于《雪饼》大侠的博客https://blog.csdn.net/rogerchen1983/article/details/79549085(值得推荐,深入浅出,但少部分涉及较深或者错误的没贴出),第二部分是对网络的复现,代码主要参考bilibili大神《霹雳吧啦Wz》https://github.com/WZMIAOMIAO/dee原创 2020-07-26 23:28:08 · 3623 阅读 · 6 评论 -
CNN经典之AlexNet网络+PyTorch复现
一、前情说明:写在前面的话本系列博客在于汇总CSDN的精华帖,类似自用笔记,不做学习交流,方便以后的复习回顾,博文中的引用都注明出处,并点赞收藏原博主。本博客大致分为两部分,第一部是转载于其他平台的关于LeNet的讲解,第二部分是自己对网络的复现,包括:数据集加载和预处理,网络构建,模型测试等二、论文解读:三、模型构建与结果展示:3.1 下载数据集集:'http://download.tensorflow.org/example_images/flower_photos.tgz原创 2020-06-24 10:58:49 · 2762 阅读 · 10 评论 -
吴恩达深度学习笔记(81)--为什么使用卷积?(Why convolutions?)
写在前面的话本系列博客在于汇总CSDN的精华帖,类似自用笔记,不做学习交流,方便以后的复习回顾,博文中的引用都注明出处,并点赞收藏原博主。吴恩达深度学习笔记(81)-为什么使用卷积?(Why convolutions?)为什么使用卷积?(Why convolutions?)我们来分析一下卷积在神经网络中如此受用的原因,然后对如何整合这些卷积,如何通过一个标注过的训练集训练卷积神经网络做个简单概括。和只用全连接层相比,卷积层的两个主要优势在于参数共享和稀疏连接,举例说明一下。假设有一张32×32×转载 2020-06-09 23:51:56 · 492 阅读 · 1 评论 -
CNN经典之LeNet网络+PyTorch复现
一、前情说明:写在前面的话本系列博客在于汇总CSDN的精华帖,类似自用笔记,不做学习交流,方便以后的复习回顾,博文中的引用都注明出处,并点赞收藏原博主。本博客大致分为两部分,第一部是转载于其他平台的关于LeNet的讲解,第二部分是自己对网络的复现,包括:数据集加载和预处理,网络构建,模型测试等二、CNN经典模型:LeNet近几年来,卷积神经网络(Convolutional Neural Networks,简称CNN)在图像识别中取得了非常成功的应用,成为深度学习的一大亮点。CNN发展至今,已经有原创 2020-06-09 23:22:00 · 1381 阅读 · 1 评论 -
全连接层详解
注:本系列博客在于汇总CSDN的精华帖,类似自用笔记,不做学习交流,方便以后的复习回顾,博文中的引用都注明出处。1、什么是全连接层:全连接层(fully connected layers,FC)在整个卷积神经网络中起到“分类器”的作用。如果说卷积层、池化层和激活函数等操作是将原始数据映射到隐层特征空间的话,全连接层则起到将学到的“分布式特征表示”(下面会讲到这个分布式特征)映射到样本标记空间的作用。在实际使用中,全连接层可由卷积操作实现:对前层是全连接的全连接层可以转化为卷积核为1x1的卷积;而前层是原创 2020-06-04 16:32:23 · 162197 阅读 · 26 评论 -
YOLO-MASK对图像数据集进行清洗
一、前情介绍之前在捣鼓yolo系列模型,尝试着对coco的羊数据集进行训练,可是发现不管怎么调参,Map一直在60几,死活上不了70。后来在一位资深老算法师的指点下,才明白,精度很大程度取决于数据集,因此一直围绕着数据集进行优化,这篇博客大概记录了对脏数据的清洗方法。二、下载模型代码地址:https://github.com/AlexeyAB/Yolo_mark因为该模型是使用了底层工具...原创 2020-05-06 17:00:28 · 10003 阅读 · 7 评论 -
对小样本数据进行数据增强
一、前情介绍在之前对yolov3的学习中,有时候发现小样本数据集容易出现过拟合或者泛化能力不强的问题,在对这一问题提出的不同解决方法进行了摸索和尝试,发现提高数据集样本容量是一个比较直接和简单粗暴的方法,以下纪录这一实验方法。二、环境直接交代环境,都是相对较简单,在这里博主没遇到过坑osnumpyPILimgaug三、代码import xml.etree.ElementTre...原创 2020-05-06 15:47:51 · 16110 阅读 · 66 评论 -
COCO数据集提取某类并转化为VOC格式
1、下载COCO数据集:https://blog.csdn.net/aLWX_hust/article/details/88350248?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522158541005019726867813769%2522%252C%2522scm%2522%253A%252220140713.13005687...原创 2020-03-29 00:03:59 · 4003 阅读 · 1 评论 -
yolov3使用聚类重置anchor
1、原理1.1 前言:anchor box其实就是从训练集的所有ground truth box中统计(使用k-means)出来的在训练集中最经常出现的几个box形状和尺寸。可以预先将这些统计上的先验(或来自人类的)经验加入到模型中,这样模型在学习的时候,瞎找的可能性就更小了些(玄学思想)。1.2 公式:1.3 效果:只能加快模型收敛的速度,对模型的其他性能无影响2、重置2.1 模...原创 2020-03-28 23:35:54 · 6941 阅读 · 28 评论 -
win10+torch+yolov3训练自己数据集
前情说明:穷苦学生一枚,恰好最近在学习object detection,用到了yolov3模型,捣鼓了好几天,看了各大论坛、贴吧、CSDN,知乎,博客园等好多大佬前辈们写的文章(吐血.jpg),在这里将自己的过程和结果写出来,希望大家能少走点弯路。环境:这个很重要!!!!!window 10pytorch 1.4.0opencv-pythontqdmmatplotlib...原创 2020-03-19 00:06:52 · 16419 阅读 · 176 评论 -
window10下打开摄像头实现Pytorch-YOLOv3的实时监测
1、参考:opencv调用YOLOv3模型进行目标检测基于python3的Opencv(一)-打开摄像头显示图像python+OpenCV+YOLOv3打开笔记本摄像头模型检测2、配置:笔者的运行环境为:window 10pycharmopencv-pythonPytorch-YOLOv3朋友们可下载笔者修改过的Pytorch-YOLOv3模型:Pytorch-YOLOv...原创 2020-03-08 17:33:49 · 8642 阅读 · 38 评论 -
Pytorch-YOLOv3使用步骤详解(win系统下)
1、下载1.0、环境这是笔者环境,各位可根据笔者环境考虑是否要继续window 10python 3.6.5torch 1.01.1、模型下载https://github.com/eriklindernoren/PyTorch-YOLOv31.2、安装所需库打开requirements.txt,傻瓜式操作安装所需库:numpy(笔者安装numpy最新版本时需要升级pip...原创 2020-03-06 23:18:41 · 11683 阅读 · 31 评论