- 博客(3)
- 资源 (6)
- 收藏
- 关注
原创 强化学习概论2
参考链接:https://morvanzhou.github.io/tutorials/machine-learning/reinforcement-learning/1-1-A-RL/https://morvanzhou.github.io/tutorials/machine-learning/reinforcement-learning/1-1-B-RL-methods/定义强化学习是一...
2019-05-20 21:38:52 536
原创 model-free强化学习-Policy-based
Policy-based将神经网络作为一个Actor,输入是观测observation,表示形式是一个向量或一个矩阵。输出是每个行为对应的概率,类似于分类问题中的判断类别,会对应每个类别有个概率,如下如所示:考虑一个episode τ={s1,a1,r1,s2,a2,r2,...,sT,aT,rT,}\tau=\{s_{1},a_{1}, r_{1},s_{2},a_{2}, r_{2},....
2019-05-20 00:42:13 583
原创 变分自编码器VAE实现MNIST数据集生成by Pytorch
Recap自编码器:自编码器中,需要输入一个原始图片,原始图片经过编码之后得到一个隐向量,隐向量解码产生原图片对应的图片。在这种情况下,只能生成原图片对应的图片而无法任意生成新的图片,因为隐向量都是原始图片确定的。变分自编码器VAE引入变分自编码器(Variational autoencoder)可以在遵循某一分布下随机产生一些隐向量来生成与原始图片不相同的图片,而不需要预先给定原始图片。为...
2019-05-18 17:57:08 14734 13
2016年国科大NLP(自然语言处理)期末考试题-宗老师
2019-07-07
360断网急救箱独立版
2018-04-17
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人