![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
狗都不学的深度学习
文章平均质量分 88
0.0
STATEABC
FPGA天下第一!
展开
-
EfficientNet网络详解并使用pytorch搭建模型
1.EfficientNet网络设计思想在原论文中,作者通过网络搜索技术同时探索输入分辨率,网络的深度depth、channel的宽度width对准确率的影响,构建EfficientNet网络。根据以往的经验,增加网络的深度depth能够得到更加丰富、复杂的特征,但网络的深度过深会面临梯度消失,训练困难的问题。增加网络的width能够获得更高细粒度的特征并且也更容易训练,但对于width很大而深度较浅的网络往往很难学习到更深层次的特征。增加输入网络的图像分辨率能够潜在得获得更高细粒度的特征模板,但对原创 2022-05-04 15:37:47 · 4784 阅读 · 2 评论 -
YOLOv5网络详解
前言YOLOv5项目的作者是Glenn Jocher并不是原Darknet项目的作者Joseph Redmon,并且这个项目至今都没有发表过正式的论文。官方源码仓库:https://github.com/ultralytics/yolov5原创 2022-05-02 19:51:16 · 25382 阅读 · 5 评论 -
YOLOv4网络详解
0前言在YOLOv4论文中,作者其实就是把当年所有的常用技术罗列了一遍,然后做了一堆消融实验。1.YOLOV4的网络改进部分1、主干特征提取网络:DarkNet53 => CSPDarkNet53、使用Mish激活函数2、特征金字塔:SPP结构,PAN结构优化策略:1.Eliminate grid sensitivity2.Mosaic data augmentation3. IoU threshold(正样本匹配)4. Optimizer Anchors5. CIoU(定位损失原创 2022-04-21 09:01:25 · 7140 阅读 · 0 评论 -
YOLO系列理论合集(YOLOv1~v3)
YOLOv11.论文思想(1)将一副图像分为SxS个网格(grid cell),如果某个目标的中心落在这个网格中,则这个网格负责预测这个目标。(2)每一个网格要预测B个bounding box,每个bounding box除了要预测位置(x,y,w,h)之外,还要附带预测一个confidence值。每个网格还要预测C个类别的分数。SxS个网格,每个网格要预测B个bounding box,还要预测C个类别。网络输出是一个SxSx(5xB+C)的张量。x和y在0~1之间,用中心网格的相对坐标表示;原创 2022-04-19 10:04:19 · 4244 阅读 · 0 评论 -
GhostNet网络详解
1. GhostNet网络一张图片经过神经网络进行特征提取后,能够得到很多特征图。在特征图中会有一些相似性很高,这就是神经网络中存在的特征图冗杂的情况(如图中扳手相连的两幅特征图)。作者认为可以对其中的一个特征图进行(Cheap Operations)简单的线性运算从而生成更多相似特征图,从而可以使用更少的参数生成更多的特征图,将相似的特征图认为是彼此的Ghost。2. Ghost Module作者用Ghost Module代替传统卷积,首先采用普通的1x1卷积对输入图片进行通道数的压缩,然后原创 2022-04-15 16:51:51 · 21712 阅读 · 0 评论 -
SSD算法理论
SSD算法SSD(Single Shot MultiBox Detector)是one-stage目标检测方法,one-stage算法就是目标检测和分类是同时完成的,其主要思路是利用CNN提取特征后,均匀地在图片的不同位置进行密集抽样,抽样时可以采用不同尺度和长宽比,物体分类与预测框的回归同时进行,整个过程只需要一步,所以其优势是速度快。SSD网络模型输入图像shape为300x300x3(将图像输入网络之前会进行缩放);将图像输入到VGG16的backbone中,贯穿Conv5_3(即虚线前的原创 2022-04-05 15:44:28 · 3284 阅读 · 0 评论 -
FPN结构详解
Feature Pyramid NetworksFPN主要解决的是物体检测中的多尺度问题,通过简单的网络连接改变,在基本不增加原有模型计算量的情况下,大幅度提升了小物体检测的性能。(a)为特征图像金字塔结构,要检测不同尺度目标时会将图片进行缩放,针对每个尺度的图片都依次通过进行预测。(速度慢)(b)为单一特征图结构,将图片通过backbone得到最终特征图,在最终特征图上进行预测。(对小目标不友好)©为金字塔特征层次结构,将图片输入backbone,在backbone正向传播过程中得到的不同的特征原创 2022-04-03 10:24:01 · 5703 阅读 · 0 评论 -
RCNN、Fast-RCNN、Faster-RCNN网络详解
RCNNRCNN算法流程:1.一张图片生成1k~2k个候选区域(使用Selective Search方法);2.对每个候选区域,使用深度网络(即图片分类网络)提取特征;3.特征送入每一类的SVM分类器,判别是否属于该类;4.使用回归器精细修正候选框位置。1.候选区域的生成利用Selective Search算法通过图像分割的方法得到一些原始区域,然后使用一些合并策略将这些区域合并,得到一个层次化的区域结构,这些结构就包含着肯能需要的物体。2.对每个候选区域,使用深度网络提取特征将200原创 2022-04-02 15:09:34 · 6453 阅读 · 0 评论 -
ShuffleNetv1、v2网络详解、使用pytorch搭建模型ShuffleNetv2并基于迁移学习训练
1.ShuffleNetv1网络详解另一种轻量级网络网络创新点:(1)提出了channel shuffle的思想(2)在ShuffleNet Unit中全是GConv和DWConv(1)channel shuffle的思想在很多网络中都有1x1逐点卷积,这会造成有限的通道之间充满约束,造成精度损失;可以应用通道稀疏连接,例如组卷积(group convolutions),通过确保每个卷积操作仅在对应的输入通道组上,组卷积可以显著的降低计算损失;如果多个组卷积堆叠在一起,会有一个副作用:GC原创 2022-04-01 12:05:33 · 3990 阅读 · 0 评论 -
Pytorch中自定义Dataset读取数据
项目文件:custom_dataset├─ main.py ├─ my_dataset.py└─ utils.py数据集使用pytorch搭建AlexNet并训练花分类数据集1.model.pyimport osimport torchfrom torchvision import transformsfrom my_dataset import MyDataSetfrom utils import read_split_data, plot_data_loader_原创 2022-03-31 17:00:08 · 2572 阅读 · 0 评论 -
MobileNetv3网络详解、使用pytorch搭建模型并基于迁移学习训练
1.MobileNetv3网络详解提出了MobileNetv3-Large和MobileNetv3-Small两种不同大小的网络结构,主要的区别是通道数的变化与bneck的次数。网络的创新点:(1)更新Block(bneck)(2)使用NAS搜索参数(Neural Architecture Search)(3)重新设计耗时层结构(1)更新Block加入了轻量级的注意力模型;利用h-swish代替swish函数。...原创 2022-03-29 16:43:11 · 10304 阅读 · 3 评论 -
MobileNetv1、v2网络详解、使用pytorch搭建模型MobileNetv2并基于迁移学习训练
MobileNetv1、v2网络详解传统卷积神经网络专注于移动端或者嵌入式设备中的轻量级CNN网络,相比于传统卷积神经网络,在准确率小幅降低的前提下大大减少模型参数与运算量。(相比VGG16准确率减少了0.9%,但模型参数只有VGG的1/32)网络的创新点:(1)Depthwise Coinvolution(大大减少运算量和参数数量)(2)增加超参数α、β...原创 2022-03-27 18:52:43 · 5770 阅读 · 1 评论 -
ResNeXt网络详解并使用pytorch搭建模型
1.ResNetXt网络详解原创 2022-03-30 00:09:09 · 2401 阅读 · 0 评论 -
ResNet网络详解并使用pytorch搭建模型、并基于迁移学习训练
ResNet网络详解原创 2022-03-25 15:32:41 · 6738 阅读 · 0 评论 -
GoogLeNet网络详解并使用pytorch搭建模型
1.GoogLeNet网络详解网络中的创新点:(1)引入了Inception结构(融合不同尺度的特征信息)(2)使用1x1的卷积核进行降维以及映射处理 (虽然VGG网络中也有,但该论文介绍的更详细)(3)添加两个辅助分类器帮助训练(4)丢弃全连接层,使用平均池化层(大大减少模型参数,除去两个辅助分类器,网络大小只有vgg的1/20)Inception结构...原创 2022-03-24 16:49:06 · 2451 阅读 · 0 评论 -
VGG16网络详解并使用pytorch搭建模型
VGG网络结构网络中的亮点:通过堆叠多个3x3的卷积核来代替大尺度卷积核(减少所需参数),可以拥有相同的感受野在卷积神经网络中,决定某一层输出结果中一个元素所对应的输入层的区域大小,被称作感受野。通俗的解释是,输出feature map上的一个单元对应输入层上的区域大小。在VGG中,使用三个3x3的卷积核可以替代一个7x7的卷积核(步长默认为1):论文中提到通过这种方法能够减少所需参数:假设输入输出channel为C,那么使用7x7卷积核所需参数为7x7xCxC=49C3;堆叠三个3x3卷积原创 2022-03-23 20:02:17 · 4283 阅读 · 0 评论 -
使用pytorch搭建AlexNet并训练花分类数据集
深度学习学习笔记导师博客:https://blog.csdn.net/qq_37541097/article/details/103482003导师github:https://github.com/WZMIAOMIAO/deep-learning-for-image-processing代码用的导师的,自己又加了些备注,就放在自己的github里了:https://github.com/Petrichor223/Deep_Learning/tree/master网络结构网络介绍及结构这一部分原创 2022-03-23 15:38:02 · 3668 阅读 · 0 评论 -
pytorch官方demo实现图像分类(LeNet)
深度学习学习笔记导师博客:https://blog.csdn.net/qq_37541097/article/details/103482003导师github:https://github.com/WZMIAOMIAO/deep-learning-for-image-processing代码用的导师的,自己又加了些备注,就放在自己的github里了:网络是以LeNet网络搭建的,文件分为三部分:official-demo├─ model.py ├─ predict.py├─ tr原创 2022-03-22 20:06:35 · 2188 阅读 · 0 评论 -
《Python编程与实战》学习笔记
2.1 在交互式环境中输入表达式没什么好说的print("Hello world!")print("6+6")print("dog+cat")print("6*cat")2.2整型、浮点型和字符串数据类型数据类型例子整型(int)-2,-1,0,1,2浮点型(float)-1.25,-1.0,0.0,1.0字符串(atirs)‘a’,‘aa’,‘hello’2.21改变类型将数据从一种类型转成另一种类型float() #从一个字符串或者证原创 2022-03-22 14:13:02 · 871 阅读 · 0 评论