自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 进击J1:ResNet-50算法实战与解析

何恺明提出了一种残差结构来实现上述恒等映射(图1):整个模块除了正常的卷积层输出外,还有个分支把输入直接连到输出上,该分支输出和卷积的输出做算术相加得到最终的输出,用公式表达就是H(x)= F(x)+x^2,x 是输入, F(X)是卷积分支的输出, H(x)是整个结构的输出。可以证明如果 F(x)分支中所有参数都是0,H(x)就是个恒等映射。残差结构人为制造了恒等映射,就能让整个结构朝着恒等映射的方向去收敛,确保最终的错误率不会因为深度的变大而越来越差。

2024-07-26 10:46:44 568

原创 麻醉医生的深度学习之旅 P10:Pytorch实现车牌识别

本次实验主要是熟悉如何导入并识别无法分类的数据集,以及通过自定义一个MyDataset加载车牌数据集并完成车牌识别。同时理解了在要求模型输出结果是多维数据时,可以使用 -1 在计算中自动推断。由于近期任务比较繁重,所以这次实验有些划水了。原本想尝试作图对loss与accuracy进行实时显示,以及复习一些其他的操作都没有完成,希望下周开启进阶营后能多花些时间好好钻研。

2024-07-16 21:40:30 929

原创 麻醉医生的深度学习之旅 P9:YOLOv5-Backbone模块实现

本次实验主要是尝试运用YOLOv5算法中的Backbone模块搭建网络,对比用C3模块实现的结果,可以看到测试集的准确率有所提升,loss也更小了。以 YOLOv5s 模型为例,其主要由 Backbone、Neck 和 Head 三部分组成,网络模型见下图。Backbone主要负责对输入图像进行特征提取。Neck负责对特征图进行多尺度特征融合,并把这些特征传递给预测层。Head进行最终的回归预测。【YOLOv5】Backbone、Neck、Head各模块详解。

2024-07-08 22:16:51 573

原创 麻醉医生的深度学习之旅 P8:YOLOv5-C3模块实现

本次实验主要是尝试运用YOLOv5算法中的C3模块搭建网络,另外通过修改优化器比较实验结果对于 Adam 和 SGD 的差异有了更深刻的理解。最后尝试了增加/调整C3模块与Conv模块来提高准确率,训练集准确率和损失有了明显的改善,但测试集变化不大,有待下周进一步学习探索。YOLOv5 是一种单阶段目标检测算法,该算法在 YOLOv4 的基础上添加了一些新的改进思路,使其速度与精度都得到了极大的性能提升。输入端。

2024-07-02 12:14:25 962

原创 麻醉医生的深度学习之旅 P7:咖啡豆识别(VGG-16复现)

本次实验主要是VGG-16的复现,同时完成自己搭建VGG-16网络框架。验证集准确率达到100%(完成✅)使用PPT画出VGG-16算法框架图(略微尝试,有待进一步学习)在不影响准确率的前提下轻量化模型(完成✅)

2024-06-25 20:21:04 728

原创 麻醉医生的深度学习之旅 P6:VGG-16算法-Pytorch实现人脸识别

本次实验的重点任务是调整代码提高测试集准确率,难度较大。虽然这次实验在拔高任务中失败了,但在一次次“炼丹”中感受到了科学的艺术魅力,作为一个菜鸟“调参侠”,逐渐明晰了不断试错去寻求一个平衡点,只有在阴阳调和的情况下才能得到一个理想的结果。下周的P7继续努力!保存训练过程中的最佳模型权重(完成✅)调用官方的VGG-16网络框架(完成✅)测试集准确率达到60%(多次调整代码未能实现目标,还有待进一步学习)手动搭建VGG-16网络框架(完成✅)# 卷积层# 全连接层# 卷积层# 展平。

2024-06-18 22:16:27 955

原创 麻醉医生的深度学习之旅 P5:Pytorch实现运动鞋识别

本次实验的重点任务是设置动态学习率,在训练过程中学习率不是固定不变的,而是根据一定的策略或规则进行动态调整。在与P4进行对比过程中我发现:设置超参这一步在P4中是放在编写函数之前的,但在P5中放到了编写函数之后,且损失函数放到了正式训练中,不知这样调整顺序是何用意?另外对于保存最佳模型的理解还不够充分,不知上述代码是否正确。在训练初期,较大的学习率可以帮助模型快速探索参数空间,加速收敛。但随着训练的进行,模型逐渐接近最优解,过大的学习率可能会导致模型不稳定或错过最优解。

2024-06-09 22:32:12 1305

原创 麻醉医生的深度学习之旅 P4:Pytorch实现猴痘病识别

训练过程中保存效果最好的模型参数(完成✅,通过判断测试集最高acc)加载最佳模型参数识别本地的一张图片(完成✅)调整网络结构使测试集accuracy到达88%(重点)(完成✅,通过更改优化器实现)调整模型参数并观察测试集的准确率变化(完成✅)尝试设置动态学习率(未完成)测试集accuracy到达90%(未完成,最高只有88.8%)本周的代码相对于上周增加了指定图片预测与保存并加载模型。

2024-06-04 22:06:49 740

原创 麻醉医生的深度学习之旅 P3:Pytorch实现天气识别

通过本次实验熟悉了从本地加载并分割数据集的方法,同时进一步掌握了CNN的搭建和使用拔高部分的要求还在摸索中,后面继续学习如何调用模型识别本地图片数据、模型是基本固定的,所以在尝试通过调参、增加训练轮数等提高测试集accuracy。

2024-05-28 16:02:13 957

原创 麻醉医生的深度学习之旅 P2:CIFAR10彩色图片识别

通过本期实验,再次复习并强化了深度学习的模型训练套路,为日后自主编写完整的深度学习程序打下基础数据收集:收集用于训练和测试模型的数据集数据预处理:清洗数据,进行归一化、标准化,以及数据增强等操作定义模型架构:根据问题的性质设计神经网络的结构,选择合适的层和激活函数编译模型:配置模型的损失函数、优化器和评估指标训练模型:使用训练数据对模型进行训练,调整模型参数评估模型:使用验证集或测试集评估模型的性能模型调优:根据评估结果对模型进行调整,包括调整网络结构、超参数等,“调参大法好”

2024-05-21 22:28:51 1050 1

原创 麻醉医生的深度学习之旅 P1:Pytorch 实现 mnist 手写数字识别

首先,需要掌握一些数学基础:如线性代数、微积分、概率论和统计学等。个人感觉最枯燥难受的一部分😭,但是这些知识有助于理解深度学习和机器学习的原理和算法。所以还是得静下心来慢慢啃,可以参考李沐的《动手学深度学习》第二章内容。这部分其实对我来说没那么重要,所以我没有花太多时间去找教学视频,点到即止。其次,需要学习机器学习的基本概念和方法,如监督学习、无监督学习、回归、分类、聚类、降维等。机器学习是一种让计算机从数据中学习规律和知识的技术,它是深度学习的基础和前提。可以参考李宏毅的《机器学习》课程的内容。

2024-05-14 23:41:01 855 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除