机器学习 李宏毅 L28L29-Deep Generative Model

本文介绍了三种深度生成模型:Pixel RNN用于图像和语音生成,VAE通过变分自编码器实现语言生成,并在编码空间中引入噪声,GAN则通过对抗训练生成逼真样本。VAE解释了如何使用高斯混合模型进行概率分布估计,而GAN则通过生成器和判别器的博弈来提升生成质量。
摘要由CSDN通过智能技术生成

生成模型1: Pixel RNN

产生图像时,每次产生一个像素点。也就是,训练一个网络,输入为一个三维的vector,输出为另外一个三维的vector。可以使用Pixel RNN进行图像生成、语音生成等。

如果需要练习,可以提供该课程提供的792个Pokemon突袭那个,图像为20*20大小,数据库地址。实验结果如下图:

ML-LHY-L1-1.PNG

生成模型2: VAE (Variational Autoencoder)

ML-LHY-L1-1.PNG

VAE生成语言,输入为sentence,输出也为sentence。对于输入的数据,在code space上进行等距连接,然后选取稍微偏移的点,进行decode,产生输出数据。这对应了autoencoder的方式,而生成对应了在code space中间加入了噪声,即下图中, m1,m2,m3 m 1 , m 2 , m 3 对应了编码的区间, σ1,σ2,σ3 σ 1 , σ 2 , σ 3 对应了编码的噪声,而指数化则将其转换为正数。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值