[Autoencoder(AE)]手书动画

最新推荐文章于 2024-09-04 14:31:41 发布

cv2016_DL

最新推荐文章于 2024-09-04 14:31:41 发布

阅读量205

点赞数 3

文章标签： transformer 人工智能 llama 算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012374012/article/details/141813459

版权

[Autoencoder(AE)]手书动画✍️

图生文和文生图虽然都是生成类型任务，但模型架构和思想却有很大不同，与CLIP一样，AE也是学习文生图的最佳选择。

自编码器用于学习数据的低维表示，常用于图像压缩、降维、去噪等任务；但由于缺乏控制变量，所以不太适合用于文生图，但它为后续变分自编码器（VAE）奠定了基础。

-- 网络架构 --

编码器

线性层(4,3)

ReLU激活

线性层(3,2)

ReLU激活

解码器

线性层(2,3)

ReLU激活

线性层(3,4)

-- 步骤详解 --

[1] 给定

↳ 四个训练样本 X1, X2, X3, X4

[2] 自动

↳ 将训练样本复制为目标 (Y')，目标就是训练样本本身。

↳ 目的是训练网络重构训练样本。

[3] 编码器: 第1层 + ReLU

↳ 将输入与权重和偏置相乘

↳ 应用ReLU，将负值划掉 (-1 -> 0)

[4] 编码器: 第2层 + ReLU

↳ 将特征与权重和偏置相乘

↳ 应用ReLU，将负值划掉 (-1 -> 0)

↳ 这一层通常被称为"bottleneck"，因为它的输出(绿色)的特征维度(2)比输入特征(4)少得多。

[5] 解码器: 第1层 + ReLU

↳ 将特征与权重和偏置相乘

↳ 应用ReLU，划掉负值。这里没有负值需要划掉。

[6] 解码器: 第2层

↳ 将特征与权重和偏置相乘

↳ 输出(Y)是解码器尝试从降维到2D的表示(绿色)重构训练样本。

[7] 损失梯度和反向传播

↳ 计算输出(Y)和目标(Y')之间的均方误差(MSE)损失的梯度。

↳ 公式是 2 * (Y - Y')

↳ 首先我们计算输出(Y) - 目标(Y')

↳ 然后我们将每个元素乘以2

↳ 这些梯度启动反向传播过程，用于更新权重和偏置。

关注

3
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
[Autoencoder(AE)]手书动画

↳ 这一层通常被称为"bottleneck"，因为它的输出(绿色)的特征维度(2)比输入特征(4)少得多。↳ 计算输出(Y)和目标(Y')之间的均方误差(MSE)损失的梯度。↳ 输出(Y)是解码器尝试从降维到2D的表示(绿色)重构训练样本。↳ 将训练样本复制为目标 (Y')，目标就是训练样本本身。↳ 应用ReLU，划掉负值。↳ 应用ReLU，将负值划掉 (-1 -> 0)↳ 应用ReLU，将负值划掉 (-1 -> 0)↳ 首先我们计算输出(Y) - 目标(Y')↳ 公式是 2 * (Y - Y')
复制链接

扫一扫

cv2016_DL CSDN认证博客专家 CSDN认证企业博客

码龄11年

149: 原创

7198: 周排名

5975: 总排名

37万+: 访问

: 等级

5663: 积分

1304: 粉丝

1545: 获赞

63: 评论

1350: 收藏

私信

关注

热门文章

分类专栏

最新评论

初学者指南：了解 PyTorch 的 torch.nn 模块
ha_lydms: 非常不错的技术领域文章分享，解决了我在实践中的大问题！博主很有耐心，更有对知识的热忱和热爱，写了这么实用有效的分享，值得收藏点赞。
在目标检测数据集上微调Florence-2
tang1234qing1234hua: 博主，能分享微调的源码工程吗
腾讯优图开源多模态大模型VITA : GPT-4o的简易平替！
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/619262801。
大模型面经之bert和gpt区别
好难怎么办: 每次看完过段时间就忘了，博主总结的真好
计算机视觉算法面试
张彦峰ZYF: BN训练的时候，均值和方差的统计量都是在batch维度上统计得到的，但是测试的时候batch size一般是1，没办法得到统计量，因此一般会保存最后一个训练批次得到的统计量，或者对最后几个批次的统计量进行moving average，用于最后的测试。

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。