2020年12月_qq_42498154

12月 11月 10月

原创生成对抗网络GAN（一）摘要

生成对抗网络GAN1.前序1.1.判别模型和生成模型1.2.其他GAN2.GAN的原理与组成2.1GAN原理2.2.GAN本质1.前序1.1.判别模型和生成模型1,判别模型：数学表示是y=f(x),条件概率分布为p(y|x),输入一张训练集图片时，判别模型输出分类标签y，模型学习的是输入图片x与输出的类别标签的映射关系，即在x的条件下，输出y的概率。2,生成模型：数学表示是概率分布p(x),没有约束条件的生成模型是无监督模型，将给定的简单先验分布，映射为训练集图片的像素概率分布p(x),即输出一张服

2020-12-04 23:17:36 483

原创强化学习之Actor-Critic

强化学习Actor Critic1.概念2.优缺点3.原理4.代码DDPG1.概念2.优缺点A3CPPOActor Critic1.概念Actor是一个神经网络Critic也是一个神经网络，他们是不同的神经网络，Actor用于预测行为的概率，Critic是预测在这个状态下的价值。结合了Policy Gradient（Actor）和Function Approximation（Critic）的方法，Actor基于概率选行为，Critic（可以用Q-learning或者Value-based）估计每一

2020-12-04 23:16:20 13704 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 生成对抗网络GAN（一）摘要

原创 强化学习之Actor-Critic

空空如也

空空如也

原创生成对抗网络GAN（一）摘要

原创强化学习之Actor-Critic