生成式多模态之AE DAE/MAE VAE VQ-VAE/VQ-VAE2

AIVoyager

已于 2024-07-20 13:54:39 修改

阅读量335

点赞数 12

分类专栏： AIGC 文章标签：人工智能生成式多模态 AIGC

于 2024-07-20 13:45:30 首次发布

本文链接：https://blog.csdn.net/qq_35215756/article/details/137638103

版权

1. AE

自编码器(Autoencoder，AE)是一种无监督学习的神经网络，用于学习输入数据的压缩表示。是一种瓶颈架构（ bottleneck），它使用编码器将高维输入x 转换为潜在的低维Code h，然后使用解码器将潜在Code h进行重构，得到最终的输出x’。

在这里插入图片描述

class autoencoder(nn.Module):
    def __init__(
          self, 
          x_dim,
          hidden_dim=256,
          z_dim=50
        ):
        super(autoencoder, self).__init__()
        
        # Define autoencoding layers
        self.enc_layer1 = nn.Linear(x_dim, hidden_dim)
        self.enc_layer2 = nn.Linear(hidden_dim, z_dim) 

        # Define autoencoding layers
        self.dec_layer1 = nn.Linear(z_dim, hidden_dim)
        self.dec_layer2 = nn.Linear(hidden_dim, x_dim) 

    def encoder(self, x):
        # Define encoder network
        x = F.relu(self.enc_layer1(x))
        z = F.relu(self.enc_layer2(x))
        return z
        
    def decoder(self, z):
        # Define decoder network
        output = F.relu(self

最低0.47元/天解锁文章

AIVoyager

关注

12
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
生成式多模态之AE DAE/MAE VAE VQ-VAE/VQ-VAE2

在VAE中，编码器仍然将输入数据映射到一个低维潜在空间，但是与潜在空间中的单个点不同，编码器生成潜在空间上的概率分布。（Variational Auto-Encoder）就是借助了encoder-decoder的结构去做生成，和AE最主要的区别就是不再去学习中间的bottleneck特征了，而是引入概率框架来生成输入数据的压缩表示，去学习一种分布。是一种瓶颈架构（ bottleneck），它使用编码器将高维输入x 转换为潜在的低维Code h，然后使用解码器将潜在Code h进行重构，得到最终的输出x’。
复制链接

扫一扫

专栏目录

年份	1月	2月	3月	4月	5月	6月	8月	9月	10月
2020					DETR	DDPM			DDIM、VisionTransformer
2021	CLIP、DALL·E		Swin Transformer
2022	BLIP			DALL·E 2			StableDiffusion、BEiT-3、Midjourney V3
2023	BLIP2		VisualChatGPT、Midjourney V5、GPT4、Diffusion Transformers	SAM				DALL·E3
2024		Sora、StableDiffusion3

生成式多模态之AE DAE/MAE VAE VQ-VAE/VQ-VAE2

目录

1. AE

“相关推荐”对你有帮助么？