自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 扩散模型(三):基于UNet2DModel的扩散模型算法搭建

很明显,UNet2DModel模块相比于BasicUNet更为复杂,使用了约170万个参数(BasicUNet使用了30多万个)。算法的基础上,将BasicUNet更换为UNet2DModel,并修改采样预测的过程即可。这本教材后,对教材里所提的内容进行了自我消化,总结总结。

2024-03-14 19:26:29 713

原创 扩散模型基础(二):采样过程

采样过程是扩散模型实现数据预测的关键,对实现在高噪声环境下的预测效果具有很重要的意义,也是从Xt寻找最优X0的过程。也就是说,通过在预测模型中通过多次迭代,根据每次最好的预测结果继续往前预测,通过T次迭代后得到较为理想的预测效果。在遇到效果不好的时候,可以采用更多的n_step(如:50次),并调整模型配置、学习率、优化器等,以求获得更好的运行效果。这本教材后,对教材里所提的内容进行了自我消化,总结总结。),对扩散模型的带噪数据预测进行优化。在BasicUNet模型基础上(

2024-03-12 14:44:12 678

原创 扩散模型基础(一):基于BasicUNet的扩散模型算法搭建

上采样是一种常见的操作,特别是在深度学习中的图像处理任务,比如图像分割(如U-Net架构)和生成对抗网络(GANs)中,可以通过不同的方式实现上采样,包括最近邻插值、线性插值、双线性插值(对于2D数据),三次插值等。我们选取了数据集中的8条数据,并人为添加不同程度的噪声,使用训练好的BasicUnet模型进行预测,得到了预测结果,完成了基于BasicUNet的扩散模型算法的搭建。,有较为详细的数学推导过程。扩散模型的本质是预测噪声,对一张具有噪声的输入量通过预测噪声进行逐步去噪,直至还原的过程。

2024-03-12 09:28:52 2422 1

原创 神经网络基础—基于梯度下降法实现神经网络

一、神经网络的基本含义根据蔡自兴所著的《人工智能原理及应用》的定义:人工神经网络是由大量的人工神经元互相连接,模拟人脑神经系统的结构和功能。主要分为三层:输入层、隐藏层和输出层。输入层是输入我们的样本数据,通过隐藏层的计算得到输出层的结果。其中有几个很重要的函数需要了解:(1)激活函数:由于我们进行学习时很多场景并不一定是线性关系,很多是非线性的关系。但是我们人工神经网络利用的还是线性回归的思想。比如:y = w1 * x1 + w2*x2 + w3 * x3 。 y与x1、x.

2021-05-20 22:07:38 1490

原创 使用torch 本地导入数据集 以Cifar10 为例

刚刚开始学习机器视觉和数据挖掘,使用了一个非常经典的数据集 Cifar10。但是啊,通过官网下载Cifar10,速度实在是让人崩溃。因此为了开展学习我就从其他网站找了数据集下载到了本地。下载地址很多,CSDN上一搜一大把的。下载下来以后好多文章都在讲如何本地导入Cifar,我也尝试了一些他们的办法,但是不太好用。自己一边查阅一边实验,找打了一个基于python3.9以上版本。分享记录一下:import torchfrom torch.utils.data import DataLoa

2021-04-29 11:22:07 1881 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除