qq_57815235-CSDN博客

原创 YOLOv5-Backbone模块实现

再一次把yolov5的整体结构过了一遍。YOLOv5的架构包括Backbone、Neck和Head三个部分。Backbone部分通常使用CSPDarknet53，Neck部分使用PANet（Path Aggregation Network），而Head部分负责产生预测，包括边界框的坐标、对象类别和置信度。适合需要快速准确检测的应用场景。

2024-06-28 20:19:33 359

原创 YOLOv5-C3模块实现

C3模块主要包括以下几个部分：一个Bottleneck块，特征分离，特征融合。C3模块使用了多个Bottleneck块，这些块通过卷积操作提取不同尺度和不同特征的图像信息。C3模块应用了CSPNet架构，减少了计算量。

2024-06-21 21:39:10 361

原创咖啡豆识别（VGG-16复现）

使用了之前的动态学习率，调整SGD的学习率，学习调整VGG内部网络结构，（未完成）轻量化模型有很多选择，后续会继续进行学习，作为补充。

2024-06-14 21:44:09 381

它主要使用3x3的卷积核和2x2的最大池化层，通过堆叠卷积层和池化层来构建深层网络在VGG网络中，所有的卷积层都使用了相同大小的卷积核（3x3）和相同的步长。VGG网络在多个卷积层和池化层后，包含了三个全连接层。迁移学习适用于数据量不足的情况。在迁移学习中，在大规模数据集上预训练的模型仅需少量的调整即可适应新任务。VGG网络简洁且深层的架构有效捕捉图像的复杂特征。我尝试了对模型的不同层进行微调，理解到每一层网络如何影响最终的学习效果。

2024-05-31 22:28:18 286

原创 Pytorch实现运动鞋识别

本周主要学习了动态学习率的设置，并且复习了上一周的识别本地图片的方法。适当的学习率可以使模型更快收敛到最优解，并且通过调整学习率，有助于模型跳出局部最小值，逐渐减小学习率有助于在训练后期进行更精细的调整，提高模型的泛化能力。继续努力吧！

2024-05-24 22:15:31 252 1

原创猴痘图像识别

每一周结束的项目都感觉到自己进步，第一周磕磕绊绊的敲代码，到现在对这些代码已经很眼熟了，并且形成了自己的笔记（代码+论文小记，比较乱没有放这里来）。后续还要继续改进这个代码，完成更高的要求。

2024-05-17 21:36:37 128

原创 Pytorch实现天气识别

重点学习了卷积层的计算和池化层的计算，卷积操作专注于输入数据的局部区域，学习局部特征。每个卷积核负责从卷积窗口覆盖的区域提取特征。通过池化层，网络能够在一定程度上对输入数据中的小的平移、旋转和缩放保持不变性。还学习了怎样添加自己的数据集并读取数据，获取data_dir.

2024-05-03 12:44:01 389 3

原创 CIFAR10彩色图片识别

CIFAR-10是一个流行的计算机视觉数据集，主要用于图像识别和分类任务的训练和测试。这个数据集包含了60000张32x32像素的彩色图像，这些图像被分为10个类别，每个类别6000张图像。这些类别包括飞机、汽车、鸟、猫、鹿、狗、青蛙、马、船和卡车。在对CIFAR-10数据集训练时，首先需要对数据进行预处理，使用交叉熵损失函数，使用SGD优化器来最小化损失函数。主要学会了构建CNN网络，学习推导卷积层与池化层的计算过程。

2024-04-22 16:24:16 210 6

原创 Pytorch实现mnist手写数字识别

MNIST数据集包括了70000张手写数字的灰度图像，其中60000张用于训练，10000张用于测试。每张图像是28x28像素的大小，图像中的数字介于0到9之间。学习数据预处理和一个完整的训练和测试代码结构，模型在测试集上达到了约97%的准确率。

2024-04-15 19:58:29 173

原创图像弹性形变（Elastic Distortion)（代码）

深度学习小白，有不对的地方请大佬指正，上边代码三通道（彩色）可以应用，单通道灰度图会变成三通道，因为我作业用的是彩色图片，所以这块我还没改。正巧大作业是相关于宝塔纹的图像分割，老师只给了12张图片，于是准备应用弹性形变扩充数据集。最近在学习U-net，看到了它是通过弹性形变来扩充数据集，网络上搜了搜原理，参考。我的代码水平差的很......努力学习中！

2024-03-30 21:18:23 387 1

qq_57815235的博客