深度学习进阶之路 - 从迁移学习到强化学习

本文深入探讨深度学习的应用,强调监督学习的成熟度,并指出迁移学习作为未来可能商用的重要AI技术。文章解释了迁移学习如何解决场景转换中的数据不足问题,列举了不同迁移学习策略。接着,文章引入强化学习(DRL),阐述其在游戏AI和机器人领域的应用,以及其探索式学习的特点。强化学习通过Agent、Environment、Actions和Rewards等要素形成智能决策过程。
摘要由CSDN通过智能技术生成

一. 深度学习及其适用范围

       大数据造就了深度学习,通过大量的数据训练,我们能够轻易的发现数据的规律,从而实现基于监督学习的数据预测。

        

       没错,这里要强调的是基于监督学习的,也是迄今为止我在讲完深度学习基础所给出的知识范围。

       基于卷积神经网络的深度学习(包括CNN、RNN),主要解决的领域是 图像、文本、语音,问题聚焦在 分类、回归。然而这里并没有提到推理,显然我们用之前的这些知识无法造一个 AlphaGo 出来,通过一张图来了解深度学习的问题域:

        

       2016年的 NIPS 会议上,吴恩达 给出了一个未来 AI方向的技术发展图,还是很客观的:

       

        毋庸置疑,监督学习是目前成熟度最高的,可以说已经成功商用,而下一个商用的技术 将会是 迁移学习(Transfer Learning),这也是 Andrew 预测未来五年最有可能走向商用的 AI技术。


二. 迁移学习(举一反三的智能)

       迁移学习解决的

  • 9
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值