algorithm
文章平均质量分 60
DeepMatter
爱好机器学习、大数据处理,主攻算法设计。希望在博客平台上与大家分享一些心得和优质的资源,共同进步。
展开
-
wake-sleep 算法的个人理解
未完待续…Wiki原创 2017-12-21 11:48:39 · 1595 阅读 · 1 评论 -
ICLR 2018 BEST PAPER
这篇文章的题目如下: 论述了如何将元学习用于非静态环境下多agents的增强学习。与传统的多agents静态环境(atari)和单agent静态环境相比,该场景更复杂,同时也与实际应用情景相吻合!该问题的提出在review中被认为是通向AGI的重要的一步。设想这样的一个游戏场景:愤怒的小鸟—游戏中的重力随着时间动态的改变,从而该场景是一个典型的非静态环境,是之前的增强学习方法所不能handl...原创 2018-06-04 01:24:31 · 1903 阅读 · 0 评论 -
some remarks on learning to learn
From Chelsea Finn Jul 18, 2017Current AI systems can master a complex skill from scratch, using an understandably large amount of time and experience. But if we want our agents to be able to ac...转载 2018-06-05 11:40:38 · 237 阅读 · 0 评论 -
meta之change bias之filter learning篇(1)
今日两弹有关Filter Learning的文章分享文章具体对比如下: 第一篇的模型思想不难想像,作者希望在实际测试场景下,模型中的某些参数是依赖于输入测试样本的。考虑如下的场景:当我们在看到一个人的侧脸时,人可以“脑补”出这个人的正脸。作为训练好的模型,我们也希望她能够根据现实中的一些场景进行合理的联想和改变—反映到模型参数上就是希望参数是一些条件输入的函数,就比如前面人脸的例子。...原创 2018-05-30 16:31:06 · 553 阅读 · 0 评论 -
meta-learning的新的理解---以Relation Network为契机的新的感触
下面给出本文的核心模型图 - 本文的核心价值: 模拟人在区分物体的过程,比如iPhone和其他安卓机的区别,一个人会找,看哪个手机有空气刘海,ok,这个有,那它就是iPhone咯! 这里边有两个过程,一个是人脑中的空气刘海—这个是人对于手机所提取到的特征;另一个是,ok,这个有,就做出它是iPhone的判断—这对应着人用先前提取的特征来在待测样本中判断待测样本和这个特征...原创 2018-06-06 22:51:26 · 2515 阅读 · 0 评论 -
贝叶斯角度对MAML的新的理解
本文依据文章title: 本文按照文章顺序进行,只抽取笔者认为的重点部分,如有不妥,还请看客给出意见建议一起进步。感兴趣的话,建议去biying原文阅读。2.1 MAML以及分层贝叶斯表示的回顾 - 元学习作为基于梯度的超参数优化器 参数化的元学习目的是find一些shared参数,当面临novel task时,能够轻松的find适用于该task的参数。 MAML提供了一中基...原创 2018-06-08 00:38:39 · 3755 阅读 · 1 评论