机器学习李宏毅 L28L29-Deep Generative Model

最新推荐文章于 2023-03-17 19:11:04 发布

OKgagaga

最新推荐文章于 2023-03-17 19:11:04 发布

阅读量1.1k

点赞数

分类专栏：机器学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/guyanbeifei/article/details/79243935

版权

本文介绍了三种深度生成模型：Pixel RNN用于图像和语音生成，VAE通过变分自编码器实现语言生成，并在编码空间中引入噪声，GAN则通过对抗训练生成逼真样本。VAE解释了如何使用高斯混合模型进行概率分布估计，而GAN则通过生成器和判别器的博弈来提升生成质量。

摘要由CSDN通过智能技术生成

生成模型1： Pixel RNN

产生图像时，每次产生一个像素点。也就是，训练一个网络，输入为一个三维的vector，输出为另外一个三维的vector。可以使用Pixel RNN进行图像生成、语音生成等。

如果需要练习，可以提供该课程提供的792个Pokemon突袭那个，图像为20*20大小,数据库地址。实验结果如下图：

生成模型2： VAE (Variational Autoencoder)

VAE生成语言，输入为sentence，输出也为sentence。对于输入的数据，在code space上进行等距连接，然后选取稍微偏移的点，进行decode，产生输出数据。这对应了autoencoder的方式，而生成对应了在code space中间加入了噪声，即下图中, $m_1,m_2,m_3$ 对应了编码的区间， $\sigma_1,\sigma_2,\sigma_3$ 对应了编码的噪声，而指数化则将其转换为正数。

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。