“元学习”的理解

元学习论文总结||小样本学习论文总结

2017-2019年计算机视觉顶会文章收录 AAAI2017-2019 CVPR2017-2019 ECCV2018 ICCV2017-2019 ICLR2017-2019 NIPS2017-2019

 


1、定义 

元学习(Meta Learning)或者叫做“学会学习”(Learning to learn),它是要“学会如何学习”,即利用以往的知识经验来指导新任务的学习,具有学会学习的能力。

当前的深度学习大部分情况下只能从头开始训练。使用Finetune来学习新任务,效果往往不好,而Meta Learning 就是研究如何让神经玩两个很好的利用以往的知识,使得能根据新任务的调整自己

研究情况 
基本上目前的学会学习研究还是从基本的图像识别入手,希望能够实现快速的图像实现。然而当前的研究仍是百花齐放状态,仍在研究有效的算法。

有人指出Meta Learning是实现通用人工智能的关键,因为它使人工智能能学会思考,与推理。

2 机器人学习

由于机器人学习的核心是要实现机器人的智能决策,说到决策,我们必然要想到深度增强学习(Deep Reinfocement Learning),深度增强学习就是要解决智能决策问题。我们也已经看到了很多将DRL应用到机器人的成果,让我们看到了希望。然而,由于深度增强学习本身固有的缺陷(需要巨量的trial and error),使得仅仅用深度增强学习很难真正应用到实际的机器人中。在深度增强学习的大框架下,我们还需要:

  1. 终生学习Life Long Learning
  2. 少样本学习Few Shot Learning
  3. 多任务学习Multi Task Learning
  4. 多智能体学习Multi Agent Learning
  5. 学会学习Meta Learning/Learning to Learn
  6. 迁移学习Transfer Learning

也就是说,从机器人的角度,我们希望机器人能够实现的智能决策需要具备以下几点:

  1. 能够不断通过与环境交互来学习提升决策能力,也就是终生学习
  2. 能够快速学习,面对新的任务,可以通过少量的训练就掌握
  3. 可以处理多种任务
  4. 可以实现多智能体的协作完成任务
  5. 能够学会学习,这和快速学习本质是一样的,就是发现学习规律,面对新任务可以快速入手
  6. 这也和快速学习的目标一致,希望通过迁移以往学习的经验来加速新任务的学习。

大家看到了,对于这些研究分支,大多指向一点,就是希望机器人能够和人类一样具备快速学习的能力,能够累积经验,这样的机器人才有可能具备强大的智能决策能力。除了快速学习,由于机器人还需要和人交互,那么如何通过人机交互实现学习也是一个研究方向,但这不是最核心的方向。

然后我们这里考虑的是学会学习方法论与深度学习结合的研究这个研究方向就非常短了,可以说也就是去年才真正火起来,涌现出了多篇关于学会学习的论文。我在github上也总结了一些学会学习的papers:

songrotek/Meta-Learning-Papers

基本上目前的学会学习研究还是从基本的图像识别入手,希望能够实现快速的图像实现。这确实是个不错的评判学会学习能力的一种指标。毕竟我们人可以实现一眼学习(one shot learning),人工智能如果也能实现,也就意味着人工智能真的是会学习了。

假设学会学习在2020年实现革命性的突破,在2025年,学会学习技术就可以得到广泛应用,而到2030年,拥有第1级智能的机器人就可以走进千家万户。这看起来确实是非常的乐观,也就是2020-2030将进入到机器人革命的时期,到时候或许会有一家全新的伟大公司出现来领导机器人的革命。虽然现在的Google可以说在机器人学习上投入最大,但我们总是相信会有新的高手出现来变革未来。

 

3.学会学习

深度学习的成功完全依赖于海量的数据和强大的计算资源。面对一个新的任务,我们都得重新训练一遍,非常的费时费力。对于AlphaGo,很多人就提了这样的问题:把棋盘变大一点AlphaGo还能行吗?目前的方法显然不行,AlphaGo会立马变成傻瓜。而我们人类就厉害多了,分分钟可以适应新的棋盘。我们人类拥有的快速学习能力是目前人工智能所不具备的。再举个例子人脸识别,我们人往往可以只看一面就能记住并识别,而现在的深度学习却需要成千上万的图片才能做到。因此,如何让人工智能能够具备快速学习的能力成为现在的前沿研究问题。

因此,要让机器人走进千家万户,我们需要机器人能够实时学习,不断学习,快速学习,即使面对一个新的类似的任务,也能快速掌握。这样的机器人会非常强大,能真正处理各种任务!

如何才能实现快速学习?所以,要让深度学习快速学习,就要研究如何让神经网络能够很好的利用以往的知识,使得神经网络能够根据新的任务调整自己。

在金庸的武侠世界中,有各种各样的武功,不同的武功都不一样,有内功也有外功。那么里面的张无忌就特别厉害,因为他练成了九阳神功。有了九阳神功,张无忌学习新的武功就特别快,在电影倚天屠龙记之魔教教主中,张无忌分分钟学会了张三丰的太极拳打败了玄冥二老。九阳神功就是一种学会学习的武功!我们希望神经网络也能学会学习,这样也就能快速学习啦!

我们人是基于价值观驱动的动物。我们做什么不做什么都是因为大脑里面有一杆秤在思考哪个更重要。即使有时候非常感性,也是因为感性的时候做那件事的价值最大化了。既然人拥有价值观,我们能不能让AI也拥有价值观,并利用价值观来驱动AI快速学习?

让AI在学习各种任务后形成一个核心的价值网络,从而面对新的任务时,可以利用已有的核心价值网络来加速AI的学习速度!

接下来的讲解见:https://blog.csdn.net/weixin_41803874/article/details/90551264

2017-2019年计算机视觉顶会文章收录 AAAI2017-2019 CVPR2017-2019 ECCV2018 ICCV2017-2019 ICLR2017-2019 NIPS2017-2019

近200篇小样本学习领域/元学习领域论文集

 vieo.zhu@foxmail.com申请

  • 3
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值