元学习研究综述

元学习研究综述

人工智能技术与咨询 

来源:《电信科学》,作者朱应钊等

摘要

深度学习和强化学习严重受限于小样本数据集,容易发生过拟合,无法实现类似于人类强泛化性的学习能力。元学习为此应运而生,以累积经验的方式形成“价值观”,基于本身的认知和价值判断能力对模型进行调整或优化,让智能体在实际环境中能快速学会各项复杂新任务,实现真正意义上的人工智能。首先概述了元学习的基本原理,然后根据其所采用的不同元知识形式,深入分析各类方法的研究现状,再探讨了元学习在少镜头学习、机器人学习和无监督学习等领域上的应用潜能,最后对其未来的发展趋势做出展望。

1 引言

在人工智能(artificial intelligent,AI)发展的历史长河中,深度学习的出现具有里程碑式的意义,其中的卷积神经网络(convolutional neural network,CNN)[1]、自编码器(auto-encoder,AE)[2]、循环神经网络(recurrent neural network)[3]、递归神经网络(recursive neural network)[4]及深度置信网络(deep belief network,DBN)[5]已广泛应用于图像分类、语音识别、文本处理等领域,极大推动了农业、工业、军事、航空等行业进步发展[6]。虽然深度学习在感知能力方面很强大,但是其在决策能力方面还是比较欠缺的,而后,融合了深度学习与强化学习的深度强化学习问世了。深度强化学习采用不断与实际环境进行交互[7],且在这过程中以保证累积奖赏最大化来获得最优策略的试错方式,能有效优化序列决策的问题,增强人工智能的行为决策能力[8]。可无论是单一深度学习还是深度强化学习,它们的成功在很大程度上都依靠于数百万的训练样本及大规模的计算资源。一旦缺乏这两个条件,它们的性能会大打折扣,而且这样“暴力”的学习方式与人类高效快速的学习方式有较大出入。如基于深度强化学习的智能体[9]玩《雅达利游戏》需要83小时才达到人类玩家的水平,但对于人类玩家来说,几分钟就能上手。如小孩一般只需见过几次小猫和小鸟后就能分辨它们,但基于深度学习的系统需要大量的样本训练后才能区分出小猫和小鸟。为此,现有的深度学习算法和强化学习算法等都过于依赖数据与算力,很多领域的可用样本实例是极其稀少的,且庞大的算力需求条件也会有一定的受限,导致这些算法的应用出现很大的局限性。为了突破这些界限,人工智能非常需要一种学会如何学习、快速学习的能力,才能实现进一步的革新。元学习应运而生,是可以协助人工智能实现自主学习、快速适应上手各项新的复杂任务的强有力工具。所以,有必要对元学习进行深入的研究。

2 元学习的基本原理

元学习,亦被称为学会学习,以系统的、数据驱动的方式再利用之前学过的知识或以往的经验,让人工智能实现自主、快速学会新任务。即元学习随着对每一项历史任务的学习和经验积累,在学习新任务时可以变得更加容易,所需要的训练样本更少,同时还能保证一定的算法精度。元学习旨在学会如何学习,区别于以映射方式为主的深度学习和以试错方式为主的强化学习,深度学习和强化学习的原理框图分别如图1、图2所示。

图1   深度学习原理框图

图2   强化学习原理框图

迁移学习与元学习的目标都是希望通过利用先前学到的知识快速地掌握新的技能或概念。但是,迁移学习侧重于在实例空间进行训练,通过优化单个整体任务作为转移源来训练基础模型[10]。迁移学习原理框图如图3 所示,常用的已训练好的开 源 网 络 模 型 有 VGG[11]、ResNet[12] 及GoogleNet[13]等。选择合适的模型直接迁移到目标网络上,再利用少量标注样本对目标网络进行微调;而元学习是在任务空间中进行训练,元学习的原理框图如图4 所示。每当模型尝试学习某项任务时,无论成功与否,模型都会获得有用的经验,整合这些经验形成智能体的“价值观”,代表一种会学习的能力,即抽象成函数 F(x)。若出现新的任务,在“价值观”的协助下,模型继续学习新任务的极少量样本,即可快速适应和掌握新任务,也就是抽象

  • 1
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值