自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 DCGAN图片生成

接下来就是设置了GAN训练所需的损失函数、固定的噪声输入、真实与生成样本的标签,以及用于优化判别器和生成器的Adam优化器。它结合了卷积神经网络和生成对抗网络的思想。接下来的代码是生成器的代码,这里使用的是反卷积来生成图片的。注意里面的尺寸大小,计算方式如下的公式,这里输入的噪声的尺寸为1×1,经过网络后最终得到的图片尺寸为64×64。接下来就是判别器的代码,判别器的代码比较简单,类似于普通卷积神经网络在做分类任务,只不过这里就是一个简单的二分类任务。创建文件夹用于保存图片,设置随机数。

2024-06-25 14:52:20 265 1

原创 生成对抗网络入门

理想的情况是判别器无法判别出样本的真实性,无论生成什么样的样本都输出50%的真,假概率。这里面判别器的作用是辨别数据的真伪,而不是判断数据的类别,GANs的学习过程是一个无监督的过程。从数学的角度上来讲,生成器是先假设一个数据分布,然后将真实数据输入进去,去学习真实数据里面的显示变量和隐式变量,最后得到一个和真实数据相似的数据分布。生成器原本是一个使用生成式方法的模型,它对数据的分布假设进行学习,然后根据学习到的模型重新采样出新的样本。这里是判别器的网络,主要是将输入的图像进行真伪的判别。

2024-06-20 21:01:03 383

原创 Transfrom中的多头注意力机制

这个结果表示词向量之间的关系,就是Machine-Machine,Machine-Learning,Learning-Machine,Learning-Learning的分数,分数越大,关系越密切。接着再将attention的值和V相乘,对于分数高的位置,说明网络将注意力放到了它们的身上,分数越小,这些词的关联就越小。将词汇通过embedding转换成词向量分别是X1和X2,接着再通过线性变换得到Q,K,V向量,分别是查询,键和值。接着在对结果进行一个softmax的处理,为了方便后续处理。

2024-06-04 14:34:54 390

原创 transform算法详解

1.词向量在pytorch中,将输入的文本序列变成一个词向量采用embedding algorithm算法,就是将一个词映射到一个多维的空间,一般是256或512维。输入序列的长度要根据实际情况而定,选择一个合适的序列长度,当输入序列的长度不满足时,要进行0填充,当输入序列过长时,要进行截断的操作。2.位置编码输入的序列不采用位置编码的时候,当改变输入文本序列的位置时,相同的词在不同的位置时表达的效果是一样的,这显然不符合我们的直觉,所以我们得采用位置编码。

2024-05-31 08:59:37 284

原创 yolo.py文件解读

今天我们来解读yolo.py文件,这个文件是用来搭建Yolo的网络模型。它会根据你配置的yaml文件来搭建网络模型,如果你想对Yolov5的模型做出改进,那么你需要对这个文件里的模块有一定的了解。

2024-05-17 20:31:00 285

原创 yolov5的common.py文件的解读

"""用于Conv函数和Classify函数中根据扩张系数d对卷积核的大小进行调整,再根据卷积核大小k自动计算卷积核padding数(0填充):params k: 卷积核的大小:return p: 自动计算的需要pad值(默认为0填充):params d: 卷积核的扩张系数"""if d > 1:return p这个模块可以根据输入的卷积核大小来计算pad值,主要再Conv和Classify模块中会使用到。

2024-05-08 15:18:35 873 1

原创 Yolov5的yaml文件解读

yolov5.yaml文件是yolov5网络结构的定义文件,像改进算法的需要在该文件修该相关参数,让后再修改common.py和yolo.py的相关文件。● number:表示当前模块的理论重复次数,实际的重复次数还要由上面的参数 depth_multiple 共同决定,该参数影响整体网络模型的深度。● from:表示当前模块的输入来自那一层的输出, -1 表示来自上一层的输出,层编号由 ○ 开始计数。Yolov5的head模块又多了几个新的模块,Upsample模块和Concat模块。

2024-04-30 16:14:50 532

原创 用Yolov8训练自己的数据集

上一次初步的介绍了一下Yolov8,这次就详细的说明一下如何训练自己的数据集。首先要准备数据,我这里用的是K同学啊的水果数据集。图片是不同角度下的水果照片,数据集包括水果在图片里的位置,图片大小等信息,格式为xml。训练好后我们就可以在runs/detect/train/weights文件夹中找到我们训练好的模型,一般使用best.pt模型。有了以上的数据和图片后,我们就可以训练自己的数据集了。以第一行为例,第一个数字代表的是目标的序列,后面的数字是目标的位置信息。这里我们就完成了训练自己的模型了。

2024-04-01 15:38:17 379

原创 Yolov8的安装及初步使用

我们看这个文件夹的结构,它包括两个部分是images和labels,images放着训练集的图片,labels放这训练集的标签,注意images和labels里的文件名都得一样,本文都是train2017,如果需要放入测试集,可以在images和labels都放入test2017。我们用yaml来配置文件,这里我们调用官方的coco128文件来训练,下载好coco128文件后,我们打开文件的结构。接下来就可以使用Yolov8的相关功能,今天我们介绍的是如何使用Yolov8官方的模型,以及训练好自己的模型。

2024-03-25 21:04:33 614 1

原创 神经网络基础介绍(一)

这里我们将预测函数的斜率设为w,将代价函数的斜率设置为k,通过图像我们可以发现,我们可以通过一元二次函数的斜率来判断目前的斜率和准确斜率之间的关系,当某点的斜率为正时,说明该点对应的w在准确值的右边,且斜率越小,距离准确值就越近。目前,我们很容易看出豆豆的毒性和大小关系是一个过原点的一次 函数,但是呢,吃豆人并不知道这层关系,它只会吃一个豆子,对豆子大小和毒性的关系进行修改。我们以吃豆人为例子,顾名思义,吃豆人以豆子为食,但是在一个环境下,豆豆的毒性和大小相关,如果吃了毒性过大的豆子,吃豆人就会受伤。

2024-02-21 11:37:32 828

原创 使用stm32的hal库完成接受不定长的数据

当我们收到数据后,会触发一个中断事件来完成相关操作,这里我们是使用void HAL_UARTEx_RxEventCallback(UART_HandleTypeDef *huart, uint16_t Size)函数,详细代码的如下,其含义为通过DMA发送接受的数据,然后进入接受不定长数据的状态。首先打开STM32CubeMX,创建一个新的工程项目,我是用的单片机是stm32f108c8t6,创建好项目后,我们就可以设置stm32的引脚和其他选项了。本文中这个中断事件是将接受到的数据在通过串口发送出去。

2024-01-30 10:11:16 1220 1

原创 PyQt5的安装以及使用

点击创建,会弹出一个空白界面,这里我们就加入一个一个输入框和按钮,功能为点击按钮,就可以清空输入框的内容。接着我们将该ui文件保存至我们的项目文件夹之下,之后我们从pycharm的project里找到我们保存的ui文件,右击选择External Tools的pyUIC,就可以得到一个py文件。在代码前后加入以下的代码就可以运行了。点击后就有interpreter Setting的选项了,接着选择该选项,会弹出Setting的界面,点击加号就可以在搜索框内搜索PyQt5和PyUIC,并且点击下载。

2024-01-29 15:52:21 512

原创 用tkinter写一个预测图片的小程序

接下来的代码是读取图片的代码,分为两个部分,第一部分是读取图片的路径,这个作为展示使用。另一个部分也是读取图片的路径,用来给tensorflow预测。首先是第一段代码,这部分代码是展示应用界面的主体部分,这部分包括应用的标题,按键和其功能,图片展示,图片的标题。这个部分的代码是用来预测图片的,这个部分就不详细解释了,是固定的(大概吧)。虽然很简陋,但是看结果是成功了,预测结果十分甚至九分的准。接下来就是程序的主题了,接下来我就分段讲解代码的含义。最后是展示图片,包括图片和预测名。

2024-01-19 21:05:49 377

原创 关于tensorflow的读取文件夹图片和调用模型

这里是处理图片的一段函数,将上面测试图片的文件的路径放入,将调整图片大小,转换为tensor类型。处理后的图片就可以进入模型内。这里是我用K同学Pokemon图片集得到的结果 ,不清楚为什么效果不太好,可能是训练集太少的缘故吧。这里是图片结果的名字,我这里用12345来代替。这里是用matplotlib展示图片和预测结果。我用的是DenseNet121模型。得到测试图片的文件的路径。

2024-01-19 15:29:30 459 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除