Doctor老王-CSDN博客

原创进击J1：ResNet-50算法实战与解析

何恺明提出了一种残差结构来实现上述恒等映射(图1):整个模块除了正常的卷积层输出外，还有个分支把输入直接连到输出上，该分支输出和卷积的输出做算术相加得到最终的输出，用公式表达就是H(x)= F(x)+x^2，x 是输入， F(X)是卷积分支的输出， H(x)是整个结构的输出。可以证明如果 F(x)分支中所有参数都是0,H(x)就是个恒等映射。残差结构人为制造了恒等映射，就能让整个结构朝着恒等映射的方向去收敛，确保最终的错误率不会因为深度的变大而越来越差。

2024-07-26 10:46:44 568

原创麻醉医生的深度学习之旅 P10：Pytorch实现车牌识别

本次实验主要是熟悉如何导入并识别无法分类的数据集，以及通过自定义一个MyDataset加载车牌数据集并完成车牌识别。同时理解了在要求模型输出结果是多维数据时，可以使用 -1 在计算中自动推断。由于近期任务比较繁重，所以这次实验有些划水了。原本想尝试作图对loss与accuracy进行实时显示，以及复习一些其他的操作都没有完成，希望下周开启进阶营后能多花些时间好好钻研。

2024-07-16 21:40:30 929

原创麻醉医生的深度学习之旅 P9：YOLOv5-Backbone模块实现

本次实验主要是尝试运用YOLOv5算法中的Backbone模块搭建网络，对比用C3模块实现的结果，可以看到测试集的准确率有所提升，loss也更小了。以 YOLOv5s 模型为例，其主要由 Backbone、Neck 和 Head 三部分组成，网络模型见下图。Backbone主要负责对输入图像进行特征提取。Neck负责对特征图进行多尺度特征融合，并把这些特征传递给预测层。Head进行最终的回归预测。【YOLOv5】Backbone、Neck、Head各模块详解。

2024-07-08 22:16:51 573

原创麻醉医生的深度学习之旅 P8：YOLOv5-C3模块实现

本次实验主要是尝试运用YOLOv5算法中的C3模块搭建网络，另外通过修改优化器比较实验结果对于 Adam 和 SGD 的差异有了更深刻的理解。最后尝试了增加/调整C3模块与Conv模块来提高准确率，训练集准确率和损失有了明显的改善，但测试集变化不大，有待下周进一步学习探索。YOLOv5 是一种单阶段目标检测算法，该算法在 YOLOv4 的基础上添加了一些新的改进思路，使其速度与精度都得到了极大的性能提升。输入端。

2024-07-02 12:14:25 962

原创麻醉医生的深度学习之旅 P7：咖啡豆识别（VGG-16复现）

本次实验主要是VGG-16的复现，同时完成自己搭建VGG-16网络框架。验证集准确率达到100%（完成✅）使用PPT画出VGG-16算法框架图（略微尝试，有待进一步学习）在不影响准确率的前提下轻量化模型（完成✅）

2024-06-25 20:21:04 728

原创麻醉医生的深度学习之旅 P6：VGG-16算法-Pytorch实现人脸识别

本次实验的重点任务是调整代码提高测试集准确率，难度较大。虽然这次实验在拔高任务中失败了，但在一次次“炼丹”中感受到了科学的艺术魅力，作为一个菜鸟“调参侠”，逐渐明晰了不断试错去寻求一个平衡点，只有在阴阳调和的情况下才能得到一个理想的结果。下周的P7继续努力！保存训练过程中的最佳模型权重（完成✅）调用官方的VGG-16网络框架（完成✅）测试集准确率达到60%（多次调整代码未能实现目标，还有待进一步学习）手动搭建VGG-16网络框架（完成✅）# 卷积层# 全连接层# 卷积层# 展平。

2024-06-18 22:16:27 955

原创麻醉医生的深度学习之旅 P5：Pytorch实现运动鞋识别

本次实验的重点任务是设置动态学习率，在训练过程中学习率不是固定不变的，而是根据一定的策略或规则进行动态调整。在与P4进行对比过程中我发现：设置超参这一步在P4中是放在编写函数之前的，但在P5中放到了编写函数之后，且损失函数放到了正式训练中，不知这样调整顺序是何用意？另外对于保存最佳模型的理解还不够充分，不知上述代码是否正确。在训练初期，较大的学习率可以帮助模型快速探索参数空间，加速收敛。但随着训练的进行，模型逐渐接近最优解，过大的学习率可能会导致模型不稳定或错过最优解。

2024-06-09 22:32:12 1305

原创麻醉医生的深度学习之旅 P4：Pytorch实现猴痘病识别

训练过程中保存效果最好的模型参数（完成✅，通过判断测试集最高acc）加载最佳模型参数识别本地的一张图片（完成✅）调整网络结构使测试集accuracy到达88%（重点）（完成✅，通过更改优化器实现）调整模型参数并观察测试集的准确率变化（完成✅）尝试设置动态学习率（未完成）测试集accuracy到达90%（未完成，最高只有88.8%）本周的代码相对于上周增加了指定图片预测与保存并加载模型。

2024-06-04 22:06:49 740

原创麻醉医生的深度学习之旅 P3：Pytorch实现天气识别

通过本次实验熟悉了从本地加载并分割数据集的方法，同时进一步掌握了CNN的搭建和使用拔高部分的要求还在摸索中，后面继续学习如何调用模型识别本地图片数据、模型是基本固定的，所以在尝试通过调参、增加训练轮数等提高测试集accuracy。

2024-05-28 16:02:13 957

原创麻醉医生的深度学习之旅 P2：CIFAR10彩色图片识别

通过本期实验，再次复习并强化了深度学习的模型训练套路，为日后自主编写完整的深度学习程序打下基础数据收集：收集用于训练和测试模型的数据集数据预处理：清洗数据，进行归一化、标准化，以及数据增强等操作定义模型架构：根据问题的性质设计神经网络的结构，选择合适的层和激活函数编译模型：配置模型的损失函数、优化器和评估指标训练模型：使用训练数据对模型进行训练，调整模型参数评估模型：使用验证集或测试集评估模型的性能模型调优：根据评估结果对模型进行调整，包括调整网络结构、超参数等，“调参大法好”

2024-05-21 22:28:51 1050 1

原创麻醉医生的深度学习之旅 P1：Pytorch 实现 mnist 手写数字识别

首先，需要掌握一些数学基础：如线性代数、微积分、概率论和统计学等。个人感觉最枯燥难受的一部分😭，但是这些知识有助于理解深度学习和机器学习的原理和算法。所以还是得静下心来慢慢啃，可以参考李沐的《动手学深度学习》第二章内容。这部分其实对我来说没那么重要，所以我没有花太多时间去找教学视频，点到即止。其次，需要学习机器学习的基本概念和方法，如监督学习、无监督学习、回归、分类、聚类、降维等。机器学习是一种让计算机从数据中学习规律和知识的技术，它是深度学习的基础和前提。可以参考李宏毅的《机器学习》课程的内容。

2024-05-14 23:41:01 855 1

u012249506的博客