深度学习_donkey_1993的博客-CSDN博客

深度学习

关注

文章平均质量分 72

关注数：文章数：64 文章阅读量：375691 文章收藏量：1172

作者: donkey_1993

这个作者很懒，什么都没留下…

展开

CFNet: Cascade Fusion Network for Dense Prediction

在密集预测任务中多尺度的特征融合至关重要，当前的主流的密集预测的范式是先通过BackBone提取通用特征，然后通过特征融合模块来融合BackBone中的多尺度特征，最后使用head来输出密集预测结果（检测，分割等）。作者发现BackBone的网络参数量远远大于特征融合模块，基于此发现作者提出了级联融合网络结构（CFNet）来平衡BackBone和融合模块网络的参数占比。最终提出的网络结构在Imagenet，COCO，ADE20K等数据集上取得了领先的结果。

原创 2023-03-06 11:35:52 · 3670 阅读 · 14 评论
Ubuntu，Windows下编译MNN的推理和模型转化工具

3. 在命令窗口中，进入到MNN所在的目录。cd MNN/build 先进入到build文件夹中。cd MNN/build 先进入到build文件夹中。2. 进入MNN文件夹，然后运行下面命令行。前提已经安装好Visual Studio。（目前最新版本是2.0.0）。（目前最新版本是2.0.0）。...

原创 2022-08-30 19:47:18 · 1484 阅读 · 1 评论
深度学习中的优化函数optimizer SGD Adam AdaGrad RMSProp

当前深度学习中使用到的主流的优化函数有：1. BGD（Batch Gradient Descent）,SGD（Stochastic Gradient Descent）和MBGD（Mini-Batch Gradient Descent）2. Momentum & Nesterov Momentum3. AdaGrad4. RMSProp5. Adam 这三类优化算法是最早的优化算法，它们之前的不同之处是训练时输入图片数量不同。 BGD是采用整个训练集的数据来计算损失函数对参数的梯度

原创 2022-06-10 14:11:44 · 1251 阅读 · 0 评论
基于pytorch的深度学习分类算法汇总

分类算法汇总

原创 2022-03-15 12:03:00 · 2371 阅读 · 0 评论
EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks

EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks论文下载地址：https://arxiv.org/abs/1905.11946代码下载地址：https://github.com/tensorflow/tpu/tree/master/models/official/efficientnet论文创新：在有限的资源下平衡网络深度，宽度和分辨率得到一个效果最好的网络结构。上图网络结构分别是（a）.

原创 2021-02-06 09:33:43 · 284 阅读 · 0 评论
Improving Convolutional Networks with Self-Calibrated Convolutions 2020CVPR 自校准网络结构

论文下载地址：http://mftp.mmcheng.net/Papers/20cvprSCNet.pdf代码下载地址：https://github.com/MCG-NKU/SCNet论文摘要：当前深度学习中，为提升网络效果，大多数的研究都是集中在修改网络结构上。SCNet中提出了对卷积层的改进，提出了类似于分组卷积的操作，但是每个分组都会互相影响，从而提取更加丰富的特征。该创新在分类和目标检测中在不增加计算量和参数量的基础上取得了很好的精度提升，其他网络结构可以方便嵌入。算...

原创 2020-12-11 09:21:59 · 340 阅读 · 0 评论
跑通SOLOV1-V2实例分割代码，并训练自己的数据集。

系统平台：Ubuntu18.04硬件平台：RTX2080 supercuda和cudnn版本：cuda10.0 cudnn：7.5.6pytorch版本：pytorch1.2.0环境安装：#创建solo虚拟环境conda create -n solo python=3.7 -yconda activate solo#下载solo源码，并编译git clone https://github.com/WXinlong/SOLO.gitcd SOLOpip instal...

原创 2020-08-17 14:44:35 · 8675 阅读 · 47 评论
Mask Rcnn环境搭建并训练自己的数据集（三）

数据集准备：我们需要的数据集包括原图，以及第二步为每个json生成的文件夹里面的文件。训练代码：import osimport sysimport randomimport mathimport reimport timeimport numpy as npimport cv2import matplotlibimport matplotlib.pyplot as pltimport tensorflow as tfROOT_DIR = os.path.abspath("

原创 2020-08-13 18:26:34 · 1119 阅读 · 0 评论
Mask Rcnn环境搭建并训练自己的数据集（二）准备自己的数据集

安装并运行labelme来标注数据集：#安装labelmepip install pyqt5pip install labelme#运行labelmelabelme使用labelme标注之后每张图片都会生成对应的json标注文件。将数据集转换成mask-rcnn训练数据集：首先需要修改labelme的一些转换文件，找到labelme的安装位置，并找到json_to_dataset.py这个文件。我的文件在D:\anaconda\envs\labelme\Lib\site-pack

原创 2020-08-13 17:00:31 · 1253 阅读 · 0 评论
Mask Rcnn环境搭建并训练自己的数据集（一）

硬件平台：RTX2080super 和 GTX1660Ti系统：Ubuntu18.04和Ubuntu16.04Mask-Rcnn代码地址：https://github.com/matterport/Mask_RCNN环境安装：驱动安装：显卡驱动直接通过系统设置 -> 软件和更新 -> 附加驱动直接在这里面安装。我2080驱动选择的是nvidia-435 1660选择的是nvidia-418。如果没有找到显卡驱动就需要添加ppa源...

原创 2020-08-13 16:17:58 · 846 阅读 · 2 评论
将POLY-YOLO代码跑起来的环境配置，poly-yolo训练自己的数据集

系统：ubuntu16.04和ubuntu18.04显卡驱动：网上很多教程，百度一下安装就可以。（最简单直接在软件更新里面安装）cuda安装：下载安装cuda10.0，百度网上很多教程。cudnn安装：下载安装cudnn7.6.5，百度网上很多教程。cuda和cudnn的版本要使用10.0和7.6.5不然会出现一些bug。1. 安装anaconda。https://www.anaconda.com/2. 创建虚拟环境:poly-yolo推荐的python=3.5，但是测试发现pyth

原创 2020-08-05 17:08:50 · 3246 阅读 · 27 评论
POLY-YOLO: HIGHER SPEED, MORE PRECISE DETECTION AND INSTANCE SEGMENTATION FOR YOLOV3论文阅读

论文下载地址：https://arxiv.org/pdf/2005.13243.pdf代码下载地址：https://gitlab.com/irafm-ai/poly-yolo论文创新：在YOLOv3的基础上进行了改进，解决了YOLO-v3存在标签重写和anchor分布不均衡问题。同时还增加了基于多边形预测的实例分割算法。改进之后的算法参数量只需要YOLO-v3的60%，速度快了2倍，精度提升了40%，可以进行实时实例分割。YOLO-v3存在的问题：1. 标签重写问题：从下图可以看出YOL

原创 2020-08-05 12:16:29 · 662 阅读 · 0 评论
图片预处理操作中的均值操作mean的作用以及实现代码

在进行目标检测或者分割的时候需要对图片先进行mean的预处理操作，这样做的作用是将原始图片减去整个数据集的像素均值，这样可以体现不同个体之间的区别与差异。代码实现：import numpy as npimport cv2import os # img_h, img_w = 32, 32img_h, img_w = 300, 300 #根据自己数据集适当调整，影响不大means, stdevs = [], []img_list = [] imgs_path = '/media/

原创 2020-06-28 15:40:15 · 1619 阅读 · 0 评论
End-to-End Object Detection with Transformers论文阅读笔记

论文下载地址： https://arxiv.org/abs/2005.12872代码下载地址： https://github.com/facebookresearch/detr摘要：该算法简化了目标检测算法的流程，同时将那些需要手动设计的技巧nms（极大值抑制）和anchor成功的删除掉，实现端到端自动训练和学习。DETR算法使基于集合的全局损失函数，通过二部图匹配和编码解码网络结构来强制进行唯一的预测。给定一小组固定的经过学习的object queries（后面会讲到什么是object que.

原创 2020-06-24 11:11:03 · 6354 阅读 · 0 评论
A Simple Baseline for Multi-Object Tracking多目标跟踪算法

论文下载地址：https://arxiv.org/abs/2004.01888代码下载地址：https://github.com/ifzhang/FairMOT论文摘要：近几年目标检测算法和重识别算法发展迅速。这两个是多目标跟踪算法的重要组成部分。但是现在很少有人关注，将这两个算法合并在一个网络上，因为在初期的时候就有人尝试过这种方法但是重识别网络学习的特征并不好，从而造成跟踪精度大幅下降。论文作者基于以上问题，提出了一个简单基准来提升单网络多目标跟踪算法的精度，并且取得了state-of-the-

原创 2020-05-27 17:07:47 · 3182 阅读 · 0 评论
MNN深度框架学习教程（一）编译MNN，并跑通MNN的demo

实验环境：系统：Ubuntu18.04硬件设备：PC设备和树莓派4B编译教程： MNN框架主要分为三部分：推理，训练和转换。推理：在端侧加载MNN模型进行推理的阶段。训练：训练框架上，根据训练数据训练出模型的阶段。转换：将其他训练框架模型转换为MNN模型的阶段。因此我们的编译也需要分三部分来进行编译。首先下载MNN：(我这个是使用码云进行了加速)git clone https://gitee.com/zhanzzw/MNN.git环境要求：cmake（建议...

原创 2020-05-27 15:25:47 · 15257 阅读 · 11 评论
记录在训练深度学习算法过程中遇到的问题及解决办法。持续更新中....

问题1. RuntimeError: received 0 items of ancdata"解决办法主要由两种：(出现这种错误是因为文件描述器共享策略达到了峰值)（1）将代码里面的num_workers的值设为0num_workers=0(2) 在import torch 后面增加一句话就可以解决这个问题import torchtorch.multiprocessing.set_sharing_strategy('file_system')问题2. 在复制数据集到U盘上面的时

原创 2020-05-11 16:00:42 · 5584 阅读 · 1 评论
树莓派4B快速安装pytorch，torchvision和opencv

树莓派安装pytorch1.3和torchvison0.4.0：直接使用命令：pip3 installtorch-1.3.0a0+de394b6-cp37-cp37m-linux_armv7l.whlpi3 installtorchvision-0.4.1a0+a263704-cp37-cp37m-linux_armv7l.whl就可以安装好pytorch和torchvisio...

原创 2020-04-13 09:54:22 · 6344 阅读 · 8 评论
SOLO：Segmenting Objects by Locations阅读笔记

论文下载地址： https://arxiv.org/abs/1912.04488论文摘要：当前实例分割算法大部分是先检测后分割的框架，例如Mask-RCNN算法。或者先进行语义分割，然后再通过聚类算法来进行分类。论文提出了一种实例类别概念，实例类别根据实例的位置和大小为实例中的每个像素分配类别，从而很好地将实例分割转换为可分类解决的问题。论文提出的犯法可以达到和Mask-R...

原创 2020-04-08 15:28:13 · 2231 阅读 · 0 评论
在Jetson TX2和RTX2080TI上面安装pycuda，以及遇到的一些问题解决办法。

Jetson TX2上面安装pycuda：sudo pip3 install pycuda安装过程中不会报错但是在测试demo的时候会报无法找到nvcc路径问题。找到compiler.py文件，直接将ncvv的路径改为绝对路径就可以了。RTX2080TI安装pycuda：使用的是anaconda：pip install pycuda安装过程中也不会报错，运行demo就...

原创 2020-03-24 08:54:57 · 2454 阅读 · 2 评论
FCOS: Fully Convolutional One-Stage Object Detection论文笔记

论文下载地址：https://arxiv.org/pdf/1904.01355.pdf论文代码：https://github.com/tianzhi0549/FCOS/论文创新点：本文作者提出了一种基于特征图像素点的目标检测算法。对特征图的每一个点都会通过回归网络预测一个检测检测框。该算法的优点是计算量减少了（不需要计算过检测框和真实框的IOU），超参减少了（不需要考虑anchor的大小设...

原创 2020-03-18 19:22:08 · 1601 阅读 · 0 评论
融合卷积层和BN层加速网络

BN层可以通过1*1的卷积层来代替，因此可以将BN层添加到前面的卷积层里面。链接：https://github.com/ziweizhan/fuse-conv-bn import torch import torchvision def fuse(conv, bn): fused = torch.nn.Conv2d( ...

原创 2020-03-09 17:15:24 · 2346 阅读 · 0 评论
CBAM: Convolutional Block Attention Module

论文下载地址：https://arxiv.org/pdf/1807.06521.pdf论文代码：https://github.com/ziweizhan/CBAM论文创新：论文核心是提出了新的通道注意力网络结构和空间注意力网络结构。这两个网络结构简单不会影响网络检测速度，还可以将注意力网络结构嵌入到任何CNN网络里面，适应性强。网络结构：整体网络结构：如下图所示...

原创 2020-02-28 12:42:26 · 1786 阅读 · 0 评论
Actions as Moving Points

论文下载地址：https://arxiv.org/abs/2001.04608代码地址：https://github.com/mcg2019/MOC-Detector论文创新点：当前存在的动作识别检测算法大多数都是基于anchor的，算法计算量大，并且anchor对于检测运动实例效果并不友好。作者基于以上问题提出了一个新的行为识别检测框架，将每一个运动的实例看做是移动的点（类似于Cente...

原创 2020-02-11 18:03:27 · 2556 阅读 · 0 评论
IoU，GIoU，DIoU和CIoU三种目标检测loss

IoU：使用最广泛的检测框loss。GIoU：2019年CVPR Generalized Intersection over Union: A Metric and A Loss for Bounding Box RegressionDIoU和CIoU：2020年AAAIDistance-IoU Loss: Faster and Better Learning for Bound...

原创 2020-01-16 17:49:31 · 22526 阅读 · 0 评论
在Jetson nano上面可以跑到20FPS的行人检测算法

演示视频地址：https://www.bilibili.com/video/av76489439/代码地址：https://github.com/ziweizhan/fast-object-detection-nano这个代码训练只训练了100个EPOCH，效果并不是很好。后面需要好好训练。...

原创 2019-11-21 18:02:02 · 3305 阅读 · 0 评论
Fast Visual Object Tracking with Rotated Bounding Boxes SiamMask_E目标跟踪算法论文笔记

Fast Visual Object Tracking with Rotated Bounding BoxesICCV-2019-workshop论文下载地址：https://arxiv.org/abs/1907.03892论文代码下载地址：https://github.com/ baoxinchen/siammask_e论文创新点：本论文是基于Siammask进行改进,Siamm...

原创 2019-11-20 17:47:27 · 2580 阅读 · 0 评论
pytorch转tensorrt遇到的一些问题？

1.AttributeError:module 'tensorrt' has no attribute 'PaddingMode'解决办法：是tensorrt版本问题，可以将版本升级到5.1+就可以解决这个问题。2.ValueError: negative shift count解决办法：这个是由于softmax参数设置造成的错误，之前softmax（dim=-1），将dim = ...

原创 2019-10-29 10:22:00 · 2729 阅读 · 0 评论
Jetson TX2安装jetpack4.2.2系统

1. 使用数据线将TX2和另外一台ubuntu系统的电脑（也叫上位机）（我的是ubuntu18.04）连接起来。如下图灰色线所示：2. 上位机上面下载sdk，下载地址：https://developer.nvidia.com/embedded/jetpack3. 安装sdk：sudo apt install ./sdkmanager_0.9.14-4964_amd64.deb4...

原创 2019-10-29 10:06:16 · 3004 阅读 · 3 评论
Adaptively Connected Neural Networks论文阅读

Adaptively Connected Neural Networks论文下载地址：https://arxiv.org/abs/1904.03579论文代码地址：https://github.com/wanggrun/Adaptively-Connected-Neural-Networks论文创新点：论文中提出局部信息和全局信息对于网络结构的精度影响很大，但是当前的网络结构很难同时兼...

原创 2019-10-15 18:04:14 · 2730 阅读 · 1 评论
Jetson TX2安装编译pytorch

工作需要将deepsort移植到TX2上面，从网上搜集了教程。安装教程：1. 最好是重新安装一个jetpack系统，3.2及以上都可以。2. 首先安装环境依赖：因为是在python3下面安装pytorch，所以使用pip3。sudo apt install libopenblas-dev libatlas-base-dev liblapack-dev# For OpenCVs...

原创 2019-10-14 11:52:49 · 2699 阅读 · 2 评论
Dual Attention Network for Scene Segmentation论文阅读笔记

Dual Attention Network for Scene Segmentation2018年已经挂出来，2019年被CVPR接收。文章下载地址：https://arxiv.org/abs/1809.02983代码下载地址：https://github.com/junfu1115/ DANet/论文创新点：提出了空间位置注意力机制和通道注意力机制。通...

原创 2019-10-12 10:18:56 · 1700 阅读 · 0 评论
何凯明全景分割论文Panoptic Feature Pyramid Networks

论文：Panoptic Feature Pyramid Networks论文下载地址：https://arxiv.org/pdf/1901.02446.pdf论文代码：未公布论文创新点：将语义分割的FCN和实例分割的Mask-Rcnn结合在一起。设计了Panopic FPN网络。该方法可能chen成为以后全景feng分割的基线。虽然设计理念很简单但是要将这两个网络结合在一...

原创 2019-01-15 20:28:01 · 3581 阅读 · 0 评论
BN(Batch Normalization) 原理与使用过程详解

论文名字：Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift论文地址：https://arxiv.org/abs/1502.03167 BN被广泛应用于深度学习的各个地方，由于在实习过程中需要修改网络，修改的网络在训练过程中无法收敛，就添加了BN...

原创 2018-08-20 15:47:07 · 80714 阅读 · 4 评论
Center and Scale Prediction: A Box-free Approach for Object Detection 无anchor的目标检测算法

Center and Scale Prediction: A Box-free Approach for Object Detection论文下载地址：https://arxiv.org/pdf/1904.02948.pdf代码下载地址：https://github.com/liuwei16/CSP算法的创新点：该算法的创新点就是基于关键点检测（FCN网络结构）的基础上增加了一个检测目...

原创 2019-08-22 17:10:54 · 2027 阅读 · 2 评论
SqueezeNet论文笔记

SqueezeNet ALEXNET-LEVEL ACCURACY WITH 50X FEWER PARAMETERS AND <0.5MB MODEL SIZE论文下载地址：http://arxiv.org/abs/1602.07360 论文代码：https://github.com/DeepScale/SqueezeNet SqueezeNet是一个高密小网络。高密小网络...

原创 2018-10-12 14:40:45 · 2268 阅读 · 0 评论
多目标跟踪综述2

多目标跟踪：(Multiple Object Tracking or Multiple Target Tracking, MOT or MTT)主要任务是在给定视频中同时对多个感兴趣的目标进行定位，并且维持他们的ID、记录他们的轨迹。多目标跟踪主要存在的问题：1. 确定跟踪目标的数量2.维持各自的ID3.频繁的遮挡4.轨道初始化和终止5.相似的外观6.多目标之间的影...

原创 2018-10-11 19:48:39 · 4642 阅读 · 1 评论
High Performance Visual Tracking with Siamese Region Proposal Network论文笔记

论文：High Performance Visual Tracking with Siamese Region Proposal Network文论下载：http://openaccess.thecvf.com/content_cvpr_2018/papers/Li_High_Performance_Visual_CVPR_2018_paper.pdfDaSiamRPN代码地址：https...

原创 2018-09-20 16:35:24 · 2458 阅读 · 0 评论
孪生网络Siamese Network发展历程

孪生网络又称为连体网络，网络中的连体是通过共享权值来实现。孪生网络最早是出现在1993年的论文《Signature Verification using a ‘Siamese’ Time Delay Neural Network》用于美国支票上的签名验证，即验证支票上的签名与银行预留签名是否一致。孪生网络是一种监督学习，用于度量学习。随后由于硬件的限制网络技术发展缓慢，几乎停滞不前。...

原创 2018-08-30 14:45:59 · 8010 阅读 · 0 评论
深度学习常见问题汇总。

1. 为什么输入数据需要归一化（Normalized Data）？归一化后有什么好处呢？原因在于神经网络学习过程本质就是为了学习数据分布，一旦训练数据与测试数据的分布不同，那么网络的泛化能力也大大降低；另外一方面，一旦每批训练数据的分布各不相同(batch 梯度下降)，那么网络就要在每次迭代都去学习适应不同的分布，这样将会大大降低网络的训练速度，这也正是为什么我们需要对数...

原创 2018-08-20 15:50:50 · 1454 阅读 · 0 评论

深度学习

作者: donkey_1993

CFNet: Cascade Fusion Network for Dense Prediction

Ubuntu，Windows下编译MNN的推理和模型转化工具

深度学习中的优化函数optimizer SGD Adam AdaGrad RMSProp

基于pytorch的深度学习分类算法汇总

EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks

Improving Convolutional Networks with Self-Calibrated Convolutions 2020CVPR 自校准网络结构

跑通SOLOV1-V2实例分割代码，并训练自己的数据集。

Mask Rcnn环境搭建并训练自己的数据集（三）

Mask Rcnn环境搭建并训练自己的数据集（二）准备自己的数据集

Mask Rcnn环境搭建并训练自己的数据集（一）

将POLY-YOLO代码跑起来的环境配置，poly-yolo训练自己的数据集

POLY-YOLO: HIGHER SPEED, MORE PRECISE DETECTION AND INSTANCE SEGMENTATION FOR YOLOV3论文阅读

图片预处理操作中的均值操作mean的作用以及实现代码

End-to-End Object Detection with Transformers论文阅读笔记

A Simple Baseline for Multi-Object Tracking多目标跟踪算法

MNN深度框架学习教程（一） 编译MNN，并跑通MNN的demo

记录在训练深度学习算法过程中遇到的问题及解决办法。持续更新中....

树莓派4B快速安装pytorch，torchvision和opencv

SOLO：Segmenting Objects by Locations阅读笔记

在Jetson TX2和RTX2080TI上面安装pycuda，以及遇到的一些问题解决办法。

FCOS: Fully Convolutional One-Stage Object Detection论文笔记

融合卷积层和BN层加速网络

CBAM: Convolutional Block Attention Module

Actions as Moving Points

IoU，GIoU，DIoU和CIoU三种目标检测loss

在Jetson nano上面可以跑到20FPS的行人检测算法

Fast Visual Object Tracking with Rotated Bounding Boxes SiamMask_E目标跟踪算法论文笔记

pytorch转tensorrt遇到的一些问题？

Jetson TX2安装jetpack4.2.2系统

Adaptively Connected Neural Networks论文阅读

Jetson TX2安装编译pytorch

Dual Attention Network for Scene Segmentation论文阅读笔记

何凯明全景分割论文Panoptic Feature Pyramid Networks

BN(Batch Normalization) 原理与使用过程详解

Center and Scale Prediction: A Box-free Approach for Object Detection 无anchor的目标检测算法

SqueezeNet论文笔记

多目标跟踪综述2

High Performance Visual Tracking with Siamese Region Proposal Network论文笔记

孪生网络Siamese Network发展历程

深度学习常见问题汇总。

MNN深度框架学习教程（一）编译MNN，并跑通MNN的demo