- 博客(2)
- 收藏
- 关注
原创 生成对抗网络GAN(一)摘要
生成对抗网络GAN1.前序1.1.判别模型和生成模型1.2.其他GAN2.GAN的原理与组成2.1GAN原理2.2.GAN本质1.前序1.1.判别模型和生成模型1,判别模型:数学表示是y=f(x),条件概率分布为p(y|x),输入一张训练集图片时,判别模型输出分类标签y,模型学习的是输入图片x与输出的类别标签的映射关系,即在x的条件下,输出y的概率。2,生成模型:数学表示是概率分布p(x),没有约束条件的生成模型是无监督模型,将给定的简单先验分布,映射为训练集图片的像素概率分布p(x),即输出一张服
2020-12-04 23:17:36 483
原创 强化学习之Actor-Critic
强化学习Actor Critic1.概念2.优缺点3.原理4.代码DDPG1.概念2.优缺点A3CPPOActor Critic1.概念Actor是一个神经网络Critic也是一个神经网络,他们是不同的神经网络,Actor用于预测行为的概率,Critic是预测在这个状态下的价值。结合了Policy Gradient(Actor)和Function Approximation(Critic)的方法,Actor基于概率选行为,Critic(可以用Q-learning或者Value-based)估计每一
2020-12-04 23:16:20 13704 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人