meta learning
文章平均质量分 78
zz_ytj
这个作者很懒,什么都没留下…
展开
-
论文笔记--Meta-Inverse RL with Probabilistic Context Variables
PEMIRL:Probabilistic Embeddings for Meta-Inverse RL核心思想方法IRL基本框架AIRLProbabilistic Context VariableMI regularization over Latent Variable总结核心思想其实这篇论文就就会meta learning with latent variable和IRL框架的结合。IRL...原创 2020-02-21 18:23:41 · 558 阅读 · 0 评论 -
论文笔记--Meta Learning for Better RL
online meta-critic learning for off-policy actor-critic methods核心思想FormulationBi-level OptimizationMeta-critic Design总结核心思想一般的元学习是用来在任务分布上学习,通过以往的大量任务训练过程来总结出经验指导分布中未曾见过的新任务的学习。然而这篇论文关注的是一般的single-t...原创 2019-12-23 14:22:16 · 456 阅读 · 0 评论 -
论文笔记--Guided Meta-Policy Search
论文笔记-- Guided Meta-policy Search--nips19核心思想Guided Meta-Policy Search元学习阶段(二阶段)专家策略学习阶段(一阶段)一点思考核心思想传统的元强化学习方法在meta-training过程中需要大量的数据,因为很多是on-policy的。在许多问题中很难满足。本文的思想是在元学习阶段(learn a RL procedure;外循...原创 2019-12-13 21:32:39 · 711 阅读 · 0 评论 -
论文笔记--Meta learning with implicit gradient
Meta-learning with implicit gradients--nips19论文思想Few-shot case formulaImplicit MAML AlgorithmPractical Algorithm论文思想原始的MAML算法一个很大的挑战是外循环(元更新)需要通过对内循环(梯度自适应)过程进行求导,一般就要求存储和计算高阶导数。这篇论文的核心是利用隐微分方法,求解过程...原创 2019-12-12 19:15:55 · 1995 阅读 · 1 评论