“元学习”的理解_元学习训练的效果如何-CSDN博客

本文链接：https://blog.csdn.net/weixin_41803874/article/details/90546993

元学习论文总结||小样本学习论文总结

2017-2019年计算机视觉顶会文章收录 AAAI2017-2019 CVPR2017-2019 ECCV2018 ICCV2017-2019 ICLR2017-2019 NIPS2017-2019

1、定义

元学习（Meta Learning）或者叫做“学会学习”（Learning to learn），它是要“学会如何学习”，即利用以往的知识经验来指导新任务的学习，具有学会学习的能力。

当前的深度学习大部分情况下只能从头开始训练。使用Finetune来学习新任务，效果往往不好，而Meta Learning 就是研究如何让神经玩两个很好的利用以往的知识，使得能根据新任务的调整自己

研究情况
基本上目前的学会学习研究还是从基本的图像识别入手，希望能够实现快速的图像实现。然而当前的研究仍是百花齐放状态，仍在研究有效的算法。

有人指出Meta Learning是实现通用人工智能的关键，因为它使人工智能能学会思考，与推理。

2 机器人学习

由于机器人学习的核心是要实现机器人的智能决策，说到决策，我们必然要想到深度增强学习（Deep Reinfocement Learning），深度增强学习就是要解决智能决策问题。我们也已经看到了很多将DRL应用到机器人的成果，让我们看到了希望。然而，由于深度增强学习本身固有的缺陷（需要巨量的trial and error），使得仅仅用深度增强学习很难真正应用到实际的机器人中。在深度增强学习的大框架下，我们还需要：

终生学习Life Long Learning
少样本学习Few Shot Learning
多任务学习Multi Task Learning
多智能体学习Multi Agent Learning
学会学习Meta Learning/Learning to Learn
迁移学习Transfer Learning

也就是说，从机器人的角度，我们希望机器人能够实现的智能决策需要具备以下几点：

能够不断通过与环境交互来学习提升决策能力，也就是终生学习
能够快速学习，面对新的任务，可以通过少量的训练就掌握
可以处理多种任务
可以实现多智能体的协作完成任务
能够学会学习，这和快速学习本质是一样的，就是发现学习规律，面对新任务可以快速入手
这也和快速学习的目标一致，希望通过迁移以往学习的经验来加速新任务的学习。

大家看到了，对于这些研究分支，大多指向一点，就是希望机器人能够和人类一样具备快速学习的能力，能够累积经验，这样的机器人才有可能具备强大的智能决策能力。除了快速学习，由于机器人还需要和人交互，那么如何通过人机交互实现学习也是一个研究方向，但这不是最核心的方向。

然后我们这里考虑的是学会学习方法论与深度学习结合的研究，这个研究方向就非常短了，可以说也就是去年才真正火起来，涌现出了多篇关于学会学习的论文。我在github上也总结了一些学会学习的papers：

songrotek/Meta-Learning-Papers

基本上目前的学会学习研究还是从基本的图像识别入手，希望能够实现快速的图像实现。这确实是个不错的评判学会学习能力的一种指标。毕竟我们人可以实现一眼学习（one shot learning），人工智能如果也能实现，也就意味着人工智能真的是会学习了。

假设学会学习在2020年实现革命性的突破，在2025年，学会学习技术就可以得到广泛应用，而到2030年，拥有第1级智能的机器人就可以走进千家万户。这看起来确实是非常的乐观，也就是2020-2030将进入到机器人革命的时期，到时候或许会有一家全新的伟大公司出现来领导机器人的革命。虽然现在的Google可以说在机器人学习上投入最大，但我们总是相信会有新的高手出现来变革未来。

3.学会学习

深度学习的成功完全依赖于海量的数据和强大的计算资源。面对一个新的任务，我们都得重新训练一遍，非常的费时费力。对于AlphaGo，很多人就提了这样的问题：把棋盘变大一点AlphaGo还能行吗？目前的方法显然不行，AlphaGo会立马变成傻瓜。而我们人类就厉害多了，分分钟可以适应新的棋盘。我们人类拥有的快速学习能力是目前人工智能所不具备的。再举个例子人脸识别，我们人往往可以只看一面就能记住并识别，而现在的深度学习却需要成千上万的图片才能做到。因此，如何让人工智能能够具备快速学习的能力成为现在的前沿研究问题。

因此，要让机器人走进千家万户，我们需要机器人能够实时学习，不断学习，快速学习，即使面对一个新的类似的任务，也能快速掌握。这样的机器人会非常强大，能真正处理各种任务！

如何才能实现快速学习？所以，要让深度学习快速学习，就要研究如何让神经网络能够很好的利用以往的知识，使得神经网络能够根据新的任务调整自己。

在金庸的武侠世界中，有各种各样的武功，不同的武功都不一样，有内功也有外功。那么里面的张无忌就特别厉害，因为他练成了九阳神功。有了九阳神功，张无忌学习新的武功就特别快，在电影倚天屠龙记之魔教教主中，张无忌分分钟学会了张三丰的太极拳打败了玄冥二老。九阳神功就是一种学会学习的武功！我们希望神经网络也能学会学习，这样也就能快速学习啦！

我们人是基于价值观驱动的动物。我们做什么不做什么都是因为大脑里面有一杆秤在思考哪个更重要。即使有时候非常感性，也是因为感性的时候做那件事的价值最大化了。既然人拥有价值观，我们能不能让AI也拥有价值观，并利用价值观来驱动AI快速学习？

让AI在学习各种任务后形成一个核心的价值网络，从而面对新的任务时，可以利用已有的核心价值网络来加速AI的学习速度！

接下来的讲解见：https://blog.csdn.net/weixin_41803874/article/details/90551264