vindicater-CSDN博客

原创复旦大学信息科学学院数据结构试卷解析

2024年春季学期信息科学学院数据结构真题回忆版

2024-07-13 14:47:04 1047 1

原创手写感知器的反向传播算法 Part3：总结：为什么我的模型不能收敛？

什么样的网络层才能收敛？不同的损失函数分别收敛的条件是什么？上限的准确率又是多少？这些问题都会在本章完成解析。这个部分作者做了比较完整的实验进行说明，也会在这一博文之中叙述出来。那么在开始本章之前，作者先贴上上一个Part的传送门。阅读本文之前建议先阅读上一组文章。

2024-01-13 11:34:52 873 1

原创手写感知器的反向传播算法 Part2：基于理论推导的代码实践：如何实现自己的第一个神经网络完成手写体识别？（下）

本文是手写BP神经网络的第三篇文章，也是接续上一篇文章，细致地介绍如何完成BP神经网络这一程序。在上一篇文章之中，作者搭好了一个深度学习框架：如果读者朋友们将那几个具体的计算的函数当做一个实现功能的黑盒，那么在上一篇文章中已经清楚网络是怎么训练，推理，优化的。那么在这一文章之中，作者将把上一篇文章中的黑盒子打开，具体介绍运算部分的代码是什么样的。而这个部分主要就是“BP_foward_for_classification”类。

2024-01-07 11:33:55 1048 1

原创手写感知器的反向传播算法 Part2：基于理论推导的代码实践：如何实现自己的第一个神经网络完成手写体识别？（上）

本文章中给出的部分虽然没有涉及到实际上的正向推理或者反向传播的具体计算方式，但是本文作者认为在重要性上不弱于下篇，也就是关于细节上如何实现正向传播和反向传播的操作介绍。因为对于初学者而言，这个范式，也就是怎么把一个程序的框架搭出来，其内在信息是相当丰富的，也是后续在各种实验中都会有用的一种技能。所以建议所有的读者仔细阅读搞懂背后的思想，内化于自身。同时敬请期待我的下篇文章。将上下两篇文章同时阅读理解之后，完成手写BP神经网络完成手写体识别将不再话下。

2024-01-06 13:24:29 922 1

原创手写感知器的反向传播算法 Part1：梯度传播的理论推导：如何计算梯度？

本文主要是从数学的角度推导反向传播的操作原理，通过具体的例子计算，给出了感知机的每层的具体梯度值，帮助读者理解感知机的最核心的关键步骤。

2024-01-03 18:51:41 1072 1

原创程序如何处理输入的语句信息？网络结构的发展过程（下）：attention机制和transformer结构

本文介绍阐述了模型结构的一个巨大的发展，从attention机制入手，介绍了Transformer的模型。到现在为止，大型的网络结构上的变动已经完全介绍完毕

2023-09-05 19:05:39 184

原创程序如何处理输入的语句信息？网络结构的发展过程（上）：从RNN到GRU，LSTM等初步改善

如何让程序将这一个个词语融合在一起形成对于句子的理解？这就是本文的主要介绍内容，涉及到：RNN到GRU与LSTM。在这一步步的发展中，模型愈来愈精细，应用的场景也愈来愈丰富。对于当今时代更重要更让人赞叹的transformer和大模型等等的内容，作者会在下一篇文章中提及。

2023-09-04 09:31:47 123 1

原创从embedding开始的NLP学习之旅：如何让机器读入语句内容？

作为本专栏的第一篇正文，作者想聊一下关于embedding的内容，这也初入NLP所第一个遇到的一个问题：如何让计算机读入语句？。

2023-09-03 15:42:49 118

原创前言：我是如何学习NLP的基础知识的&个人对于NLP和CV相关的内容的异同分析

本文说明了后续专栏的一些包含内容并做了一些关于NLP和CV领域中宏观差别的梳理。

2023-09-02 16:24:09 244

原创总结后记——YOLOV5有什么优越的性能？

那么本文起到的作用是总结，将前文的所有修改方式等等总结归纳在一起，从中看出ultralytics公司对于YOLO这一开源项目所付出的努力心血和达成的优良效果

2023-09-02 12:14:06 2198

原创从运用网络角度解读YOLOV5源码：如何在自己的内容上运用这一模型？

本文是从头到尾解析了具体什么样的内容可以放在模型中处理，这些内容究竟是如何被处理的等内容。并且就问题出发完整的展示出了从输入到最后输出的全过程。考虑到如果再把视频处理和摄像头处理的内容放在本文中，会导致文章冗长而大部分内容又有所重复。若对此感兴趣后续我会再出一篇文章解析。至此，结合之前发表的文章，将模型是如何训练和如何运用的内容讲解了一遍。如果读者认为哪里有谬误或者讲的不清楚的欢迎在评论区批评指正，我也会尽全力修改。

2023-09-02 00:20:20 329

原创从验证训练角度解读YOLOV5的源码：程序是如何得到最后输出的maps，正确率等信息的？

前两篇文章合在一起完成的是在一个batch的图片一起训练一次时计算机内部发生的变化。但是事实上，我们需要在训练中观察训练的效果以知晓是否需要继续进行训练，训练是否已经达到了峰值。且我们需要总体的loss或者是判断的准确率这样的一个量化的标准以评价训练的效果。这就是本文的目的，对于计算上述这种有助于我们做出判断的指标的代码进行分析。由于这个部分也没有太多作为调试修改的用户能提升的，这里依旧采用整体介绍梳理网络结构和运行过程的方式进行阐释。

2023-08-31 17:33:58 1612

原创从反向传播角度解读YOLOV5源码：如何从改变优化器，损失函数计算方式等角度提升模型的性能？

本文主要关注了损失函数的计算方式和优化器反向传播的部分。事实上，本文和上一篇文章在一起解析了整个模型在训练一个Batch的过程中具体进行了什么样的操作，每一部分代码究竟有什么意义。

2023-08-31 15:52:05 1542

原创从前向传播角度解读YOLOV5的源码：如何修改网络结构或增添多余的层？

本文主要介绍的是forward部分，也就是整个模型推理的部分。通过对于整个网络的具体实现的解析，理解了的读者便能具备修改网络结构的能力。

2023-08-31 13:38:14 858

原创从数据读取的角度解读YOLOV5源码：如何使用YOLO V5训练自己的数据集？

如何基于YOLO V5训练自己的数据集？对于数据集有什么要求？为什么会有以及为什么会没有某些要求？本文将从这三个问题出发来研究YOLO V5的模型的一部分结构，将整个模型的内容串起来

2023-08-30 17:12:33 2854

原创前言——从YOLOV5的思想是如何在代码中被实现的角度拆分理解YOLO V5这样的一个大型模型

希望我的这个专栏能够帮助后来的学习者，更好的学习清楚具体这个模型的哪个部分对应着哪些代码，而某些代码具体是用来做什么的，解决上手较大模型时手足无措的问题。

2023-08-30 11:19:48 154

原创为YOLO V5铺垫：一文看懂YOLO V1-V4的变化

对于YOLO系列中的V1-4版本的内容的比较分析和讲解

2023-08-29 18:13:08 547 1

原创从数据流转的角度解析Resnet50的网络结构

作者在学习Resnet相关内容的时候，被导师提出了一个要求：对于Resnet50的网络，从数据的角度来研究和分享。具体要求是对于一张图片，要能确切的写出在整个过程中的维度变化。接下了这个任务，我在CSDN上找了很久没有发现合适的图片，遂自己使用notability研究清楚了做出了一张图，希望能对大家有所帮助。废话不多说，上图。

2023-08-29 14:48:35 698