深度学习 强化学习 迁移学习

       人工智能现在越来越火,很多非行业内的人对深度学习,强化学习,迁移学习等概念会感到很陌生,同时各种偏理论性和学术性的解释也会显得很晦涩难懂。

       其实这类机器学习的机制和人类的学习机制其实很相似,因此本文会列举一些日常中人们是如何学习的例子来说明深度学习,强化学习和迁移学习等概念。

       深度学习和强化学习都属于机器学习,而机器学习又是人工智能的一部分。深度学习和强化学习功能的有趣之处在于它们使计算机能够自己开发规则来解决问题

一.深度学习(Deep Learning)

    深度学习是近期人工智能取得重大突破的重要因素之一。现在商用的多是有监督的深度学习,需要大量的标注数据。

    举个例子,怎么教小朋友认识小狗呢。你会找些图片给小朋友看,告诉他这是小狗;路上碰见小狗,你会指给他看,告诉他这个是小狗;而小朋友指着电视上的猫说这是小狗,你会赶紧指正,告诉他这不是小狗,旁边那个才是小狗。时间久了,次数多了,小朋友就大致能够知道哪些是小狗了。其实这就是一个监督学习的过程,而你在这个过程中提供了大量的标注数据(小狗的图片,路边的指认等等)。

    从原理上来说,深度学习主要关注的是特征的提取,通过大量的标注数据来训练模型来达到精准的特征提取和识别。

二.强化学习(Reinforcement Learning)

    强化学习是一种自我修正和反馈的机器学习机制,让机器拥有自我学习和自我思考的能力。AlphaGo Zero就运用了强化学习。强化学习主要解决的是延时反馈的问题。

    举个例子,教小朋友用筷子,你只需要告诉小朋友大概的拿筷子的手法,然后示范两下,接下来就得让小朋友自己去尝试着用筷子夹东西。小朋友夹东西时的步骤,角度,力度等等因素都会对最终的结果造成影响。他们自己会从每次的结果反馈中去寻找每一步最合适的角度和力度等,慢慢地学会使用筷子。这就区别于上面我们举的有监督的深度学习的例子了,你不需要找很多很多的视频来告诉小朋友怎么做,因为影响因素太多,变量太多,很难做到足够的标准化,统一化。

    强化学习最开始是运用于机器人路径规划方向,但其实它的应用面也很广,尤其是很多有反馈的任务中,每一步对最终的结果都造成影响,这种情况下单纯的深度学习处理起来就比较困难了。

三.迁移学习(Transfer Learning)

    迁移学习是一种举一反三的能力。让机器在处理全新领域的问题时能够根据以往的模型,根据少量的数据快速训练出适合新场景的模型。最近Google推出的Cloud Auto ML就是运用了迁移学习,这不是简单的准备一个通用的预训练模型,而是用少量的数据来重新训练一个模型。

    举个例子,我们小时候有学骑自行车,可能跌倒了很多次之后,终于学会了。而我们再去学骑摩托车,相对就容易多了,你可能不会花学习骑自行车用的那么多的时间,尽管这其中还是存在很大的不同,但是依然有很多的经验可以迁移,来降低你学习新技能的难度和成本。

    在工业界,迁移学习主要解决了两个问题,第一,数据量不足的问题。虽然现在是数据大爆炸的时代,但是在某些领域,比如疑难杂症,数据量还是很少的,并且将大数据处理成为优质的可以供机器训练用的数据,还需要花费很多的人力投入。第二,个性化方面的问题。每个人的兴趣喜好,行为习惯都不同,通过一个人的数据可以分析出一个人的用户画像。但是怎么给一个没有过买书记录的人推荐书呢?可以通过迁移学习来解决,根据他的兴趣爱好,购物行为等在没有这个领域下数据的时候做到个性化推荐。

       深度学习与强化学习的区别: 深度学习和强化学习首先都是自主学习系统。它们之间的区别在于,深度学习是从训练集中学习,然后将学习到的知识应用于新数据集,是一种静态学习,而强化学习是通过连续的反馈来调整自身的动作以获得最优结果,是一种不断试错的过程,这是动态学习。

有一点需要注意,深度学习和强化学习并不是相互排斥的概念。事实上,您可以在强化学习系统中使用深度学习,这就是深度强化学习。

    总的来说,深度学习、强化学习和迁移学习不是相互独立和矛盾的存在,现在就有人尝试着把这三种学习方法结合着来解决一些具体领域的问题。如果说深度学习是现在的话,那强化学习和迁移学习就是未来,能够让机器变得不再那么笨。

 

原文出处:

https://www.jianshu.com/p/9fa31a4be587

https://baijiahao.baidu.com/s?id=1616209730311285311&wfr=spider&for=pc

  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值