2019年05月_winycg

11月 10月 09月 08月 07月 06月 05月 04月 03月 02月 01月

原创强化学习概论2

参考链接：https://morvanzhou.github.io/tutorials/machine-learning/reinforcement-learning/1-1-A-RL/https://morvanzhou.github.io/tutorials/machine-learning/reinforcement-learning/1-1-B-RL-methods/定义强化学习是一...

2019-05-20 21:38:52 536

原创 model-free强化学习-Policy-based

Policy-based将神经网络作为一个Actor，输入是观测observation，表示形式是一个向量或一个矩阵。输出是每个行为对应的概率，类似于分类问题中的判断类别，会对应每个类别有个概率，如下如所示：考虑一个episode τ={s1,a1,r1,s2,a2,r2,...,sT,aT,rT,}\tau=\{s_{1},a_{1}, r_{1},s_{2},a_{2}, r_{2},....

2019-05-20 00:42:13 583

原创变分自编码器VAE实现MNIST数据集生成by Pytorch

Recap自编码器：自编码器中，需要输入一个原始图片，原始图片经过编码之后得到一个隐向量，隐向量解码产生原图片对应的图片。在这种情况下，只能生成原图片对应的图片而无法任意生成新的图片，因为隐向量都是原始图片确定的。变分自编码器VAE引入变分自编码器（Variational autoencoder）可以在遵循某一分布下随机产生一些隐向量来生成与原始图片不相同的图片，而不需要预先给定原始图片。为...

2019-05-18 17:57:08 14734 13