自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 Yolov8网络结构学习

首先,使用1x1卷积核将输入通道数减少到原来的1/2,以减少计算量和内存消耗。yolov5中的C3模块在yolov8中被替换为了C2f,C2f则采用了yolov7中ELAN 多层堆叠的结构,增加了更多类似resnet残差块中的跳跃连接,丰富了模型的梯度流。在C2f模块中用到的DarknetBottleneck模块,使用多个3x3卷积核进行卷积操作,提取特征信息,同时其具有add是否进行残差链接的选项。与yolov5一样,每个卷积层的模块都采用步长为2的卷积核进行降采样操作,减少特征图的尺寸同时增加通道数。

2024-07-17 21:41:43 829

原创 YOLOv7网络结构学习

backbone的基本组件就介绍完了,我们整体来看下 backbone,经过 4 个 CBS 后,接入例如一个 ELAN ,然后后面就是三个 MP1 + ELAN 的输出,对应的就是 C3/C4/C5 的输出,大小分别为 80 * 80 * 512 , 40 * 40 * 1024, 20 * 20 * 1024。每一个 MP 由 5 层, ELAN 有 8 层, 所以整个 backbone 的层数为 4 + 8 + 13 * 3 = 51 层, 从 0 开始的话,最后一层就是第 50 层。

2024-07-17 11:24:22 1011

原创 YOLOv6网络结构学习

学习yolov6之前,可以先了解一下RepVGG推理是基于已训练好的模型或知识库,对新的或未知数据进行预测、分类或决策的过程。它的目的是应用已学到的知识和能力来解决实际问题。相比之下,训练是通过给定的数据集和算法调整模型参数,使模型能够从数据中学习并捕获有用的特征和规律。训练的目的是使模型在特定任务上达到较高的性能。

2024-07-15 07:42:44 490

原创 YOLOv5理论学习

SPPF。

2024-07-12 20:48:31 417

原创 yolo5s代码学习

x[i] = x[i].view(bs, self.na, self.no, ny, nx).permute(0, 1, 3, 4, 2).contiguous() # 确保张量是连续的定于forward,并接受参数xz=[] 推断时的输出z = []对输入x调整形状:bs na nx ny no nx,ny代表网格的大小 [1,3,32,32,85]

2024-07-05 19:59:28 908

原创 YOLOv4理论学习

2020 CVPR:SPP、PAN:YOLOv3优化策略:Eliminate grid sensitivity、Mosaic data augmentation、IoU threshold(match posotive samples)、Optimizered Anchors、CIOU。

2024-07-01 22:10:25 504

原创 YOLOv3 SPP

Mosaic图像增强是一种数据增强技术,通过将四张不同的图片拼接在一起,增加数据集的多样性和目标个数,从而丰富图片的背景信息。优点:增加数据的多样性、增加目标个数、BN能一次性统计多张图片的参数。

2024-06-28 18:33:27 857

原创 YOLOv3网络搭建

在train.py的63行左右,初始化模型,按住Ctrl和点击鼠标,跳转Darknet。

2024-06-27 21:11:20 1480

原创 YOLOv3网络结构配置文件

它使得任意大小的特征图都能够转换成固定大小的特征向量,其核心思想:把经典的金字塔池化结构Spatial Pyramid Pooling引入CNN中,从而使CNN可以处理任意尺寸的图片。为了解决ReLU在 x<0 时梯度消失引起的学习不安定问题,提出了Leaky ReLU, 使得在 x<0 时也能让学习继续进行,便于让模型更具活性。ReLU函数在x<0时,函数值恒为0,且其导函数也为0,导致如果神经元的输出一旦变为0后,就再也无法复活。本文件在build_utils文件夹下的parse_config.py。

2024-06-25 09:24:07 837

原创 YOLOv3理论学习

2018 CVPR。

2024-06-24 18:37:15 697

原创 YOLOv2理论学习

YOLO9000:Better,Faster,Stronger2017 VCPR448*448学习的资料:https://www.bilibili.com/video/BV1yi4y1g7ro?p=2 原文:Batch Normalization有利于提高收敛速度,帮助模型正则化减少其他形式正则化的需要。通过使用BN层,可以移除Dropout来减少过拟合。 BN层的作用是把一个mini-batch内的所有数据,从不规范的分布拉到正态分布。这样做的好处是使得数据能够分布在激活函数的

2024-06-24 09:50:50 614

原创 YOLOv3代码实现

(2)安装requirements文件,在终端输入命令pip install -r requirements.txt,有时候安装不上,检查自己的网络,换个网络则会安装成功。打开predict_test,在16行左右按照自己的需要进行修改,在当前文件下载一张测试图片,即可运行。打开runs文件夹下的文件,在空白处右键,选择在终端打开,然后输入tensorboard.exe --logdir "./",回车。把这一行的i+1改成i,运行成功,但是如何运行出来像测试单张图片一样的结果,还不会。

2024-06-21 21:31:57 1032

原创 YOLOv1理论学习

题目:You Only Look Once:Unified,Real-Time Object Detection2016 VCPR。

2024-06-20 09:49:42 910

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除