![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
深度学习
文章平均质量分 65
行*云
爬坑之路 计算机幻觉、机器瞎学、人工智障
展开
-
全文翻译【YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors】
YOLOv7在5FPS到 160 FPS 范围内的速度和准确度都超过了所有已知的物体检测器,YOLOv7 在 5 FPS 到 160 FPS 范围内的速度和准确度都超过了所有已知的目标检测器,并且在 GPU V100 上 30 FPS 或更高的所有已知实时目标检测器中具有最高的准确度 56.8% AP。YOLOv7-E6 目标检测器(56 FPS V100,55.9% AP)比基于transformer-based的检测器 SWINL Cascade-Mask R-CNN(9.2 FPS A100,53.9原创 2022-07-07 16:11:08 · 1837 阅读 · 1 评论 -
YOLOV6训练自己的数据集
YOLOV6原创 2022-06-27 16:10:27 · 319 阅读 · 0 评论 -
YOLOv6:又快又准的目标检测框架开源
YOLOv6 是美团视觉智能部研发的一款目标检测框架,致力于工业应用。本框架同时专注于检测的精度和推理效率,在工业界常用的尺寸模型中:YOLOv6-nano 在 COCO 上精度可达 35.0% AP,在 T4 上推理速度可达 1242 FPS;YOLOv6-s 在 COCO 上精度可达 43.1% AP,在 T4 上推理速度可达 520 FPS。在部署方面,YOLOv6 支持 GPU(TensorRT)、CPU(OPENVINO)、ARM(MNN、TNN、NCNN)等不同平台的部署,极大地简化工程部署时的转载 2022-06-24 13:44:54 · 1686 阅读 · 4 评论 -
深度学习模型大小与模型推理速度的探讨
0、前言当年头一次实习做算法的时候,主管给的第一个任务就是“把一个大的分割模型砍成一个小的”。当时并不理解模型“大”、“小”的真正含义,就简单的选取计算量作为评价指标,疯狂砍计算量(backbone 换 MobileNet/ShuffleNet、Conv 换成 DepthWise Conv、以及一些奇奇怪怪的融合结构等等),把模型计算量砍了将近 10 倍,结果一部署发现速度并没有快多少,反而是把最初的 ResNet 简单砍掉几个 block 效果更好。也是从那时起接触了访存量、流水线、RoofL转载 2022-02-23 16:06:42 · 1566 阅读 · 1 评论 -
Kaggle竞赛优胜解决方案、思路大合集
连接:https://farid.one/kaggle-solutions/原创 2021-05-19 11:16:44 · 437 阅读 · 0 评论 -
如何阅读一个前向推理框架?以NCNN为例
0x00. 想法来源CNN从15年的ResNet在ImageNet比赛中大放异彩,到今天各种层出不穷的网络结构被提出以解决生活中碰到的各种问题。然而,在CNN长期发展过程中,也伴随着很多的挑战,比如如何调整算法使得在特定场景或者说数据集上取得最好的精度,如何将学术界出色的算法落地到工业界,如何设计出在边缘端或者有限硬件条件下的定制化CNN等。前两天看到腾讯优图的文章:腾讯优图开源这三年,里面提到了NCNN背后的故事,十分感动和佩服,然后我也是白嫖了很多NCNN的算法实现以及一些调优技巧。所以为了让很多.转载 2020-12-23 11:20:59 · 1562 阅读 · 0 评论 -
CNN:我不是你想的那样
摘要每当我们训练完一个CNN模型进行推理时候,一旦出现人类无法解释的现象就立刻指责CNN垃圾,说这都学不会?其实你可能冤枉它了,而本文试图为它进行辩护。本文是CVPR2020 Oral论文,核心是从数据高低频分布上探讨CNN泛化能力,其注意到CNN具备捕获人类无法感知的高频成分能力,而这个现象可以用于解释多种人类无法理解的假设,例如泛化能力、对抗样本鲁棒性等。本文其实没有提出一个具体的解决办法,主要是通过CNN能够捕获人类无法感知的高频成分这一现象而对所提假设进行分析。我个人觉得本文..转载 2020-12-01 16:02:57 · 340 阅读 · 2 评论 -
超轻量目标检测模型NanoDet
华为P30上用NCNN移植跑benchmark,每帧仅需10.23毫秒,比yolov4-tiny快3倍,参数量小6倍,COCO mAP(0.5:0.95)能够达到20.6 。而且模型权重文件只有1.8mb,对比动辄数十兆的模型,可以说是相当友好了~Android Demo项目地址(提供训练代码到安卓部署一站式解决方案):RangiLyu/nanodet: ⚡Super fast and lightweight anchor-free object detection model. Onl..转载 2020-11-24 15:37:06 · 19501 阅读 · 18 评论 -
使用深度学习从视频中估计车辆的速度
车速预测代码:https://github.com/SharifElfouly/vehicle-speed-estimation我想要解决的问题是:在一辆车里有一个摄像头,我想知道车开得有多快。你显然不能看速度表,只能看视频片段本身。深度学习魔法应该能帮助我们。...原创 2020-11-19 17:16:53 · 981 阅读 · 0 评论 -
全文翻译【Scaled-YOLOv4: Scaling Cross Stage Partial Netw】
Abstract我们展示了基于CSP方法的YOLOv4对象检测神经网络,可以向上和向下缩放,并且适用于小型和大型网络,同时保持最佳速度和准确性。我们提出了一种网络缩放方法,该方法不仅可以修改深度,宽度,分辨率,还可以修改网络的结构。YOLOv4-large模型达到了最先进的结果:在Tesla V100上以15 FPS的速度为MS COCO数据集提供55.4%的AP(73.3%AP50),而随着测试时间的增加,YOLOv4-large的AP达到了55.8%(73.2 AP50)。据我们所知,这是目前所有已原创 2020-11-19 11:21:56 · 3937 阅读 · 0 评论 -
PyTorch trick 集锦
转载一篇知乎大佬写的:目录:指定GPU编号 查看模型每层输出详情 梯度裁剪 扩展单张图片维度 one hot编码 防止验证模型时爆显存 学习率衰减 冻结某些层的参数 对不同层使用不同学习率 模型相关操作 Pytorch内置one hot函数 网络参数初始化(小学生补充) 加载内置预训练模型...转载 2020-08-21 11:38:17 · 351 阅读 · 0 评论 -
Pytorch 版YOLOV5训练自己的数据集
我们曾经梦寐以求的权利,白嫖的权利:1、环境搭建https://github.com/ultralytics/yolov52、安装需要的软件 pip install -U -r requirements.txt3、准备数据在data文件下建立上面三个文件(Annotations、images与ImageSets,labels后续我们脚本生成)其中Annotations存放xml文件,images图像,ImageSets新建Main文件存放train与test文件(脚本生成),原创 2020-06-09 17:13:39 · 27372 阅读 · 113 评论 -
激活函数总结
原创 2020-04-29 09:43:15 · 344 阅读 · 0 评论 -
【CVPR2020】Designing Network Design Spaces
论文地址:https://arxiv.org/pdf/2003.13678.pdf Abstract 在这项工作中,我们提出了一个新的网络设计范例。我们的目标是帮助提高对网络设计的理解,并发现跨领域(settings)的通用设计原则。我们不是专注于设计单个网络实例,而是设...原创 2020-04-02 10:49:22 · 1949 阅读 · 0 评论 -
Mish激活函数
Diganta Misra的一篇题为“Mish: A Self Regularized Non-Monotonic Neural Activation Function”的新论文介绍了一个新的深度学习激活函数,该函数在最终准确度上比Swish(+.494%)和ReLU(+ 1.671%)都有提高地址:https://github.com/digantamisra98/Mish...原创 2020-01-16 15:01:53 · 14961 阅读 · 3 评论 -
【论文解读】Deconvolution and Checkerboard Artifacts
今天看到了一篇2016的论文,关键是可以视化卷积操作,地址如下:https://distill.pub/2016/deconv-checkerboard/ 当我们非常仔细地观察由神经网络生成的图像时,经常会看到一种奇怪的棋盘状伪像图案。在某些情况下,这种情况比在其他情况下更为明显,但是最近的模型中有很大一部分都表现出了这种行为。 非常神奇的地方,棋盘格图...原创 2020-01-09 15:33:36 · 2311 阅读 · 2 评论 -
[论文]MixNet——MixConv: Mixed Depthwise Convolutional Kernels
arXiv地址:https://arxiv.org/abs/1907.09595abstract 深度卷积在现代高效卷积神经网络中越来越受欢迎,但其核大小却常常被忽略。在本文中,我们系统地研究了不同核大小的影响,并观察到将不同尺寸核的优点结合起来可以获得更好的精度和效率。在此基础上,我们提出了一种新的混合深度卷积(MixConv),它很自然地将多个核大小混合在一个卷积中。我们的Mix...原创 2020-01-08 10:42:35 · 942 阅读 · 0 评论 -
【pytorch】基于Apex的混合精度加速
双倍训练速度,双倍的快乐,简单记录Nvidia开发的基于PyTorch的混合精度训练加速神器--Apex,可以用短短三行代码就能实现不同程度的混合精度加速,训练时间直接缩小一半三行代码搞定:from apex import ampmodel, optimizer = amp.initialize(model, optimizer, opt_level="O1") # 这里是“欧...原创 2019-12-14 14:56:02 · 1677 阅读 · 0 评论 -
INT8量化总结
原创 2019-12-06 13:55:35 · 756 阅读 · 0 评论 -
[论文解读]Gaussian YOLOv3: An Accurate and Fast Object Detector Using Localization Uncertainty
题目:Gaussian YOLOv3: An Accurate and Fast Object Detector Using Localization Uncertainty作者:Jiwoong Choi , Dayoung Chun, Hyun Kim , Hyuk-Jae Leegithud:https://github.com/jwchoi384/Gaussian_YOLOv3 ...原创 2019-11-30 11:11:33 · 682 阅读 · 0 评论 -
Batch Size大小对训练过程的影响
现在绝大多数的框架在进行mini-batch的反向传播的时候,默认都是将batch中每个instance的loss平均化之后在进行反向传播,所以相对大一点的batch size能够防止loss震荡的情况发生。从这两张图中可以看出batch size越小,相邻iter之间的loss震荡就越厉害,相应的,反传回去的梯度的变化也就越大,也就越不利于收敛。同时很有意思的一个现象,batch si...原创 2019-10-24 16:35:15 · 1901 阅读 · 0 评论 -
[论文]CVPR2019论文GIoU解读
本文是对 CVPR2019 论文《Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression》的解读: 论文地址:https://arxiv.org/abs/1902.096301.Motivation 包围框回归是2D/3D 视觉任务中一个最基础的模块,不管...原创 2019-06-12 16:07:00 · 3705 阅读 · 14 评论 -
Pytorch版本yolov3源码阅读[3]
train.pyimport argparseimport timeimport torch.distributed as distimport torch.optim as optimimport torch.optim.lr_scheduler as lr_schedulerfrom torch.utils.data import DataLoaderimport tes...原创 2019-06-05 16:18:39 · 4282 阅读 · 0 评论 -
Pytorch版本yolov3源码阅读(2)
detect.pyimport argparseimport timefrom sys import platformfrom models import *from utils.datasets import *from utils.utils import *def detect( cfg, data_cfg, weigh...原创 2019-06-05 15:36:46 · 3010 阅读 · 0 评论 -
【续上】Pytorch版本yolov3源码阅读(1)
ultralytics/YOLOV3源码解读1、model.py源码解读:不足之处希望大佬指出import osimport torch.nn.functional as Ffrom utils.parse_config import *from utils.utils import *ONNX_EXPORT = Falsedef create_modules(m...原创 2019-06-05 14:18:08 · 2064 阅读 · 2 评论 -
DL学习日记——持续跟新
SSD系列优秀项目推荐:RFBNet:code:https://github.com/ruinmessi/RFBNet代码详解:https://zhuanlan.zhihu.com/p/49615407SSD:code:https://link.zhihu.com/?target=https%3A//github.com/lufficc/SSDhttps://github.co...原创 2019-04-26 17:22:09 · 357 阅读 · 0 评论 -
YOLOV3 测试图像添加置信度与训练bmp图像格式
不足之处希望大佬指正:项目根据官网1、测试图像添加置信度: 打开src/image.c文件draw_detections函数 int i,j; for(i = 0; i < num; ++i){ char labelstr[4096] = {0}; int class = -1; char possible[...原创 2019-01-27 13:56:01 · 5064 阅读 · 2 评论 -
YOLOV3 config理解
本人小白,不足之处望大佬指出[net]# Testing# batch=1# subdivisions=1# Trainingbatch=64 subdivisions=16# 一批训练样本的样本数量,每batch个样本更新一次参数# batch/subdivisions作为一次性送入训练器的样本数量# 如果内存不够大,将batch分...原创 2018-10-29 15:53:57 · 4012 阅读 · 9 评论 -
MaskRCNN-Benchmark训练自己的数据集
这篇文章主要介绍记录使用Maskrcnn-Benchmark(连接官网)的训练自己的数据的心得,还算比较顺利。有问题,希望大佬指出,共同进步1、安装$ conda create --name maskrcnn_benchmark$ source activate maskrcnn_benchmark# this installs the right pip and dependen...原创 2019-04-01 15:04:00 · 5884 阅读 · 38 评论 -
Pytorch版本yolov3源码阅读[4]
datasets.pyimport globimport mathimport osimport randomimport shutilfrom pathlib import Pathimport cv2import numpy as npimport torchfrom torch.utils.data import Datasetfrom tqdm import t...原创 2019-06-06 14:46:04 · 3383 阅读 · 13 评论 -
MIXUP理解
论文:Bag of Freebies for Training Object Detection Neural Networks论文链接:https://arxiv.org/abs/1902.04103 网上有很多对该论文的介绍,请自行百度: 尽管mixup给人更合理一些的感觉,但它们都没有回答一个很重要的问题:两幅图像相加后,结果已经不是一幅合理的图像了,这跟我们通常说...转载 2019-06-14 14:22:33 · 6370 阅读 · 1 评论 -
论文 - Learning both Weights and Connections for Efficient Neural Networks
Han Song的Deep Compression是模型压缩方面很重要的论文。在Deep Compression中,作者提出了三个步骤来进行模型压缩:剪枝,量化和霍夫曼编码。其中,剪枝对应的方法就是基于本文要总结的这篇论文:Learning both Weights and Connections for Efficient Neural Networks。在这篇论文中,作者介绍了如何在不...转载 2019-07-08 15:25:05 · 774 阅读 · 1 评论 -
Pytorch 版YOLOV3训练自己的数据集
数据是深度学习的灵魂所在,默认你已经准备好数据,哈哈1、环境搭建git clone https://github.com/ultralytics/yolov3.git2、安装需要的软件pip install -r requirements.txt3、准备数据在data文件下建立上面三个文件(Annotations、images与ImageSets,lab...原创 2019-06-04 21:32:15 · 30337 阅读 · 200 评论 -
Maskrcnn-benchmark 训练过程中使用TensorBoard
继续上篇改的代码有点多,不足之处大佬指出运行命令:pythontools/train_net.py--use-tensorboard--config-fileexperiments/cfgs/e2e_faster_rcnn_R_50_FPN_1x.yaml1、修改maskrcnn_benchmark/config/defaults.py在最后添加_C.TENSO...原创 2019-04-04 09:37:46 · 4512 阅读 · 25 评论