自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 YOLOv5-Backbone模块实现

再一次把yolov5的整体结构过了一遍。YOLOv5的架构包括Backbone、Neck和Head三个部分。Backbone部分通常使用CSPDarknet53,Neck部分使用PANet(Path Aggregation Network),而Head部分负责产生预测,包括边界框的坐标、对象类别和置信度。适合需要快速准确检测的应用场景。

2024-06-28 20:19:33 359

原创 YOLOv5-C3模块实现

C3模块主要包括以下几个部分:一个Bottleneck块,特征分离,特征融合。C3模块使用了多个Bottleneck块,这些块通过卷积操作提取不同尺度和不同特征的图像信息。C3模块应用了CSPNet架构,减少了计算量。

2024-06-21 21:39:10 361

原创 咖啡豆识别(VGG-16复现)

使用了之前的动态学习率,调整SGD的学习率,学习调整VGG内部网络结构,(未完成)轻量化模型有很多选择,后续会继续进行学习,作为补充。

2024-06-14 21:44:09 381

原创 VGG-16算法-Pytorch实现人脸识别

它主要使用3x3的卷积核和2x2的最大池化层,通过堆叠卷积层和池化层来构建深层网络在VGG网络中,所有的卷积层都使用了相同大小的卷积核(3x3)和相同的步长。VGG网络在多个卷积层和池化层后,包含了三个全连接层。迁移学习适用于数据量不足的情况。在迁移学习中,在大规模数据集上预训练的模型仅需少量的调整即可适应新任务。VGG网络简洁且深层的架构有效捕捉图像的复杂特征。我尝试了对模型的不同层进行微调,理解到每一层网络如何影响最终的学习效果。

2024-05-31 22:28:18 286

原创 Pytorch实现运动鞋识别

本周主要学习了动态学习率的设置,并且复习了上一周的识别本地图片的方法。适当的学习率可以使模型更快收敛到最优解,并且通过调整学习率,有助于模型跳出局部最小值,逐渐减小学习率有助于在训练后期进行更精细的调整,提高模型的泛化能力。继续努力吧!

2024-05-24 22:15:31 252 1

原创 猴痘图像识别

每一周结束的项目都感觉到自己进步,第一周磕磕绊绊的敲代码,到现在对这些代码已经很眼熟了,并且形成了自己的笔记(代码+论文小记,比较乱没有放这里来)。后续还要继续改进这个代码,完成更高的要求。

2024-05-17 21:36:37 128

原创 Pytorch实现天气识别

重点学习了卷积层的计算和池化层的计算,卷积操作专注于输入数据的局部区域,学习局部特征。每个卷积核负责从卷积窗口覆盖的区域提取特征。通过池化层,网络能够在一定程度上对输入数据中的小的平移、旋转和缩放保持不变性。还学习了怎样添加自己的数据集并读取数据,获取data_dir.

2024-05-03 12:44:01 389 3

原创 CIFAR10彩色图片识别

CIFAR-10是一个流行的计算机视觉数据集,主要用于图像识别和分类任务的训练和测试。这个数据集包含了60000张32x32像素的彩色图像,这些图像被分为10个类别,每个类别6000张图像。这些类别包括飞机、汽车、鸟、猫、鹿、狗、青蛙、马、船和卡车。在对CIFAR-10数据集训练时,首先需要对数据进行预处理,使用交叉熵损失函数,使用SGD优化器来最小化损失函数。主要学会了构建CNN网络,学习推导卷积层与池化层的计算过程。

2024-04-22 16:24:16 210 6

原创 Pytorch实现mnist手写数字识别

MNIST数据集包括了70000张手写数字的灰度图像,其中60000张用于训练,10000张用于测试。每张图像是28x28像素的大小,图像中的数字介于0到9之间。学习数据预处理和一个完整的训练和测试代码结构,模型在测试集上达到了约97%的准确率。

2024-04-15 19:58:29 173

原创 图像弹性形变(Elastic Distortion)(代码)

深度学习小白,有不对的地方请大佬指正,上边代码三通道(彩色)可以应用,单通道灰度图会变成三通道,因为我作业用的是彩色图片,所以这块我还没改。正巧大作业是相关于宝塔纹的图像分割,老师只给了12张图片,于是准备应用弹性形变扩充数据集。最近在学习U-net,看到了它是通过弹性形变来扩充数据集,网络上搜了搜原理,参考。我的代码水平差的很......努力学习中!

2024-03-30 21:18:23 387 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除