![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
通俗易懂的神经网络模型
文章平均质量分 91
悠眠小虫
毛毛虫终究有一天也会破茧成蝶,我期待那一天的到来!!!
展开
-
目标检测网络:YOLOv7 模型复现
网络中使用创新的过渡模块(MP)来进行下采样,在卷积神经网络中,常见的用于下采样的过渡模块是一个卷积核大小为3x3、步长为2x2的卷积或者一个步长为2x2的最大池化。上分支是一个步长为2x2的最大池化+一个1x1卷积,下分支是一个1x1卷积+一个卷积核大小为3x3、步长为2x2的卷积,两个分支的结果在输出时会进行堆叠。在体系结构方面,E-ELAN只改变了计算模块中的结构,而过渡层的结构则完全不变。E-ELAN是基于ELAN的扩展,在大规模ELAN中,无论梯度路径长度和计算模块数量如何,都达到了稳定的状态。原创 2024-05-20 05:00:00 · 1541 阅读 · 0 评论 -
目标检测网络:YOLOv5 模型复现
这种方法使得图像的宽度和高度减半,实现二倍下采样,同时保留空间信息。随后,卷积操作进一步提取特征,生成具有更高通道数的特征图,这些特征图在空间分辨率上是原始图像的一半,但在通道维度上是原始图像的四倍。以YOLOv5s为例,原始的640× 640×3的图像输入Focus结构,采用切片操作,先变成320× 320×12的特征图,再经过一次卷积操作,最终变成320 ×320× 32的特征图。原始缩放尺寸是416*416,都除以原始图像的尺寸后,可以得到0.52,和0.69两个缩放系数,选择小的缩放系数。原创 2024-05-19 13:17:02 · 752 阅读 · 0 评论 -
目标检测网络:YOLOv4 模型复现
然后计算C \ (A ∪ B) 的面积与C的面积的比值,注:C \ (A ∪ B) 的面积为C的面积减去A∪B的面积,再用A、B的IoU值减去这个比值得到GIoU。图像是一个2D结构,像素或者特征点之间在空间上存在依赖关系,这样普通的DropOut在屏蔽语义就不够有效,但是DropBlock这样屏蔽连续区域块就能有效移除某些语义信息,比如狗的头,从而起到有效的正则化作用。,比如13×13的输入特征图,使用5×5大小的池化核池化,padding=2,因此池化后的特征图仍然是13×13大小。原创 2024-05-19 01:50:07 · 1136 阅读 · 0 评论 -
目标检测网络:YOLOv3 模型复现
(13,13,75)、(26,26,75)、(52,52,75) 特征层:每个尺度的特征图都会通过一个 1x1 卷积层来预测边界框的数量、每个边界框的类别概率、目标的置信度等。(26,26,512) 特征层:将上采样后的特征图与 Darknet-53 中原有的 (26,26,512) 特征层拼接,形成 (26,26,1024) 的特征图。简单来说,YOLOv3就是把一个图像划分成不同的网格,每个网格点负责一个区域的检测,只要物体的中心点落在这个区域,这个物体就有这个网格点来确定。锚点是每个网格的左上角)原创 2024-05-17 02:40:55 · 867 阅读 · 0 评论 -
分类神经网络3:DenseNet模型复现
这是由于卷积层的输入包含了它前面所有层的输出特征,它们来自不同层的输出,因此数值分布差异比较大,所以它们在输入到下一个卷积层时,必须先经过BN层将其数值进行标准化,然后再进行卷积操作。:用于将不同DenseBlock之间进行连接,整合上一个DenseBlock获得的特征,并且缩小上一个DenseBlock的宽高,达到下采样的效果,实质上起到。互相连接所有的层,即每一层的输入都来自于它前面所有层的特征图,每一层的输出均会直接连接到它后面所有层的输入,这可以实现。),二者均是通过建立前面层与后面层之间的。原创 2024-04-21 22:13:03 · 1108 阅读 · 0 评论 -
分类神经网络2:ResNet模型复现
在构建神经网络时,首先采用了步长为2的卷积层进行图像尺寸缩减,即下采样操作,紧接着是多个残差结构,在网络架构的末端,引入了一个全局平均池化层,用于整合特征信息,最后是一个包含1000个类别的全连接层,并在该层后应用了softmax激活函数以进行多分类任务。:由2个3x3卷积层堆叠而成,当输入和输出维度一致时,可以直接将输入加到输出上,这相当于简单执行了同等映射,不会产生额外的参数,也不会增加计算复杂度(随着网络深度的加深,这种残差模块在实践中并不十分有效);希望对大家能够有所帮助呀!ResNet网络通过。原创 2024-04-21 21:50:47 · 590 阅读 · 0 评论 -
分类神经网络1:VGGNet模型复现
通常来说,增加网络的深度可以增加模型的表示能力,使其能够学习到更复杂的特征和模式,从而在某些任务上取得更好的性能。然而,随着网络深度的增加,模型的参数数量也会增加,导致模型的复杂度增加,训练和推理的计算成本也会增加,同时可能会增加过拟合的风险。其负责捕获数据的有用信息,一般是通过堆叠多个卷积层和池化层来实现的,这些层有助于检测图像中的边缘、纹理和特征。这只是一个网络架构部分实现代码,其中 cfg 列表是 VGG 卷积和池化后的通道数,大家可以结合 VGG 的配置信息图一起对比理解。希望对大家有所帮助呀!原创 2024-04-21 19:36:25 · 1241 阅读 · 0 评论