白话学生nit-CSDN博客

原创 RNN（循环神经网络）

我们生活中的很多信息都是连续的，而BP乃至CNN模型本身接收的信息是单一的，它能处理多组单一信息，却不能将那些信息联系起来。强如CNN在处理连续数据时也只能自认不如，而我们生活中对连续数据处理的需求又是必不可少的。现在市面上的人工智能模型，在回答人们提出的问题时，也往往能结合上下文进行回答。为了能够处理这种连续数据，有了循环神经网络模型，即RNN。

2025-03-04 20:08:17 368

而我们的参数大小都是不能改变的，这时候我们就可以用填充输入值的方法，为了不影响参数的大小，我们将参数填充的部分全部设为0，这样就得到了一个形状更大但数值不变的输入值了。处理这组3通道数据，我们要用3个卷积核，即3通道卷积核，我们用3个2*2的卷积核处理。我们第一步数据是单通道的，所以卷积核也是单通道的，但是由于我们想要提取多组特征，就选择了多个单通道卷积核的卷积层得到多通道的输出值，为处理这组多通道的输入值，我们要相对的用同通道的卷积核，这里的卷积核也是在卷积层中的，它的数量将决定处理后的数据的通道数。

2025-02-08 12:40:26 740

原创深度学习--函数

一、首先最主要的一点，线性层中权重的维度和现实是反着的。（注意是右乘，x是数据，是本身已知的，传入数据是后进的，所以是数据乘以参数，为右乘）而我们用到的线性相乘公式是y = w*x +b，是左乘。NLLLoss损失函数是计算多分类问题的损失函数，它与LogSoftmax激活函数连用，以LogSoftmax计算得到的结果作为计算参数，通过接收另一个参数真实标签（每一组结果中想要预测的那个结果的索引（下标），有几组数据真实标签里的数据就有几个，范围是(0, C-1)）来计算预测值与实际值之间的误差情况。

2025-01-24 19:02:51 1060

原创 BP实战--测试手写数字

因为得到的是（（1，10））格式的，这里我们用[0]得到(1,10)的数据，再转化为numpy，将其中的数据变为列表中的值，将这个列表赋给一个变量，我们将用这个变量找预测值。但是我们的图片数据是三维的，其中有我们不需要的有关图像颜色的通道的维度，我们要将其去掉。做完主类中的定义，我们就要准备输入层的数据了，这里我们的数据是MNIST类型的图片，我们先定义好对图片数据的预处理，用torchvision.transforms.Compose()执行，先将数据转为tensor类型，再进行差值和均值的运算。

2024-11-30 14:43:22 1009