a3188045002-CSDN博客

原创 DCGAN图片生成

接下来就是设置了GAN训练所需的损失函数、固定的噪声输入、真实与生成样本的标签，以及用于优化判别器和生成器的Adam优化器。它结合了卷积神经网络和生成对抗网络的思想。接下来的代码是生成器的代码，这里使用的是反卷积来生成图片的。注意里面的尺寸大小，计算方式如下的公式，这里输入的噪声的尺寸为1×1，经过网络后最终得到的图片尺寸为64×64。接下来就是判别器的代码，判别器的代码比较简单，类似于普通卷积神经网络在做分类任务，只不过这里就是一个简单的二分类任务。创建文件夹用于保存图片，设置随机数。

2024-06-25 14:52:20 417 1

原创生成对抗网络入门

理想的情况是判别器无法判别出样本的真实性，无论生成什么样的样本都输出50%的真，假概率。这里面判别器的作用是辨别数据的真伪，而不是判断数据的类别，GANs的学习过程是一个无监督的过程。从数学的角度上来讲，生成器是先假设一个数据分布，然后将真实数据输入进去，去学习真实数据里面的显示变量和隐式变量，最后得到一个和真实数据相似的数据分布。生成器原本是一个使用生成式方法的模型，它对数据的分布假设进行学习，然后根据学习到的模型重新采样出新的样本。这里是判别器的网络，主要是将输入的图像进行真伪的判别。

2024-06-20 21:01:03 457

原创 Transfrom中的多头注意力机制

这个结果表示词向量之间的关系，就是Machine-Machine，Machine-Learning，Learning-Machine，Learning-Learning的分数，分数越大，关系越密切。接着再将attention的值和V相乘，对于分数高的位置，说明网络将注意力放到了它们的身上，分数越小，这些词的关联就越小。将词汇通过embedding转换成词向量分别是X1和X2，接着再通过线性变换得到Q，K，V向量，分别是查询，键和值。接着在对结果进行一个softmax的处理，为了方便后续处理。

2024-06-04 14:34:54 450

原创 transform算法详解

1.词向量在pytorch中，将输入的文本序列变成一个词向量采用embedding algorithm算法，就是将一个词映射到一个多维的空间，一般是256或512维。输入序列的长度要根据实际情况而定，选择一个合适的序列长度，当输入序列的长度不满足时，要进行0填充，当输入序列过长时，要进行截断的操作。2.位置编码输入的序列不采用位置编码的时候，当改变输入文本序列的位置时，相同的词在不同的位置时表达的效果是一样的，这显然不符合我们的直觉，所以我们得采用位置编码。

2024-05-31 08:59:37 519

原创 yolo.py文件解读

今天我们来解读yolo.py文件，这个文件是用来搭建Yolo的网络模型。它会根据你配置的yaml文件来搭建网络模型，如果你想对Yolov5的模型做出改进，那么你需要对这个文件里的模块有一定的了解。

2024-05-17 20:31:00 570

原创 yolov5的common.py文件的解读

"""用于Conv函数和Classify函数中根据扩张系数d对卷积核的大小进行调整，再根据卷积核大小k自动计算卷积核padding数（0填充）:params k: 卷积核的大小:return p: 自动计算的需要pad值（默认为0填充）:params d: 卷积核的扩张系数"""if d > 1:return p这个模块可以根据输入的卷积核大小来计算pad值，主要再Conv和Classify模块中会使用到。

2024-05-08 15:18:35 1650 1

原创 Yolov5的yaml文件解读

yolov5.yaml文件是yolov5网络结构的定义文件，像改进算法的需要在该文件修该相关参数，让后再修改common.py和yolo.py的相关文件。● number：表示当前模块的理论重复次数，实际的重复次数还要由上面的参数 depth_multiple 共同决定，该参数影响整体网络模型的深度。● from：表示当前模块的输入来自那一层的输出， -1 表示来自上一层的输出，层编号由 ○ 开始计数。Yolov5的head模块又多了几个新的模块，Upsample模块和Concat模块。

2024-04-30 16:14:50 874

原创用Yolov8训练自己的数据集

上一次初步的介绍了一下Yolov8，这次就详细的说明一下如何训练自己的数据集。首先要准备数据，我这里用的是K同学啊的水果数据集。图片是不同角度下的水果照片，数据集包括水果在图片里的位置，图片大小等信息，格式为xml。训练好后我们就可以在runs/detect/train/weights文件夹中找到我们训练好的模型，一般使用best.pt模型。有了以上的数据和图片后，我们就可以训练自己的数据集了。以第一行为例，第一个数字代表的是目标的序列，后面的数字是目标的位置信息。这里我们就完成了训练自己的模型了。

2024-04-01 15:38:17 532

原创 Yolov8的安装及初步使用

我们看这个文件夹的结构，它包括两个部分是images和labels，images放着训练集的图片，labels放这训练集的标签，注意images和labels里的文件名都得一样，本文都是train2017，如果需要放入测试集，可以在images和labels都放入test2017。我们用yaml来配置文件，这里我们调用官方的coco128文件来训练，下载好coco128文件后，我们打开文件的结构。接下来就可以使用Yolov8的相关功能，今天我们介绍的是如何使用Yolov8官方的模型，以及训练好自己的模型。

2024-03-25 21:04:33 838 1

原创神经网络基础介绍（一）

这里我们将预测函数的斜率设为w，将代价函数的斜率设置为k，通过图像我们可以发现，我们可以通过一元二次函数的斜率来判断目前的斜率和准确斜率之间的关系，当某点的斜率为正时，说明该点对应的w在准确值的右边，且斜率越小，距离准确值就越近。目前，我们很容易看出豆豆的毒性和大小关系是一个过原点的一次函数，但是呢，吃豆人并不知道这层关系，它只会吃一个豆子，对豆子大小和毒性的关系进行修改。我们以吃豆人为例子，顾名思义，吃豆人以豆子为食，但是在一个环境下，豆豆的毒性和大小相关，如果吃了毒性过大的豆子，吃豆人就会受伤。

2024-02-21 11:37:32 1697

原创使用stm32的hal库完成接受不定长的数据

当我们收到数据后，会触发一个中断事件来完成相关操作，这里我们是使用void HAL_UARTEx_RxEventCallback(UART_HandleTypeDef *huart, uint16_t Size)函数，详细代码的如下，其含义为通过DMA发送接受的数据，然后进入接受不定长数据的状态。首先打开STM32CubeMX，创建一个新的工程项目，我是用的单片机是stm32f108c8t6，创建好项目后，我们就可以设置stm32的引脚和其他选项了。本文中这个中断事件是将接受到的数据在通过串口发送出去。

2024-01-30 10:11:16 1478 1