【强化学习】强化学习和深度学习的区别

前言

深度学习和强化学习都属于机器学习,而机器学习又是人工智能的一部分。深度学习和强化学习功能的有趣之处在于它们使计算机能够自己开发规则来解决问题。这种学习能力对于计算机来说并不是什么新鲜事,但直到最近,我们还没有足够的数据和计算能力使其工业化。

什么是深度学习?

深度学习本质上是一个自学习系统。我们可以使用现有数据来训练算法以查找解决相应问题的模式,然后使用这种模式来对新数据进行预测。例如,我们可以训练深度学习算法来识别照片上的猫。具体步骤是:1、让计算机看数以百万计的包含猫或不包含猫的图像。2、让程序通过对图像数据进行分类和聚类(例如,边缘,形状,颜色,形状之间的距离等)来建立模式,足够多的的模式可以得到最终的预测模型。3、让程序通过预测模型来查看新的图像集,通过与预测模型的比对来确定图像中是否有猫。

**深度学习算法通过模拟我们大脑神经元网络的人工神经网络来实现类似人类大脑的功能。**算法在运行中会执行各种循环,通过缩小模式与实际的差距来改进每个循环的预测,最终建立一个最优预测模型。

苹果的Face ID(人脸识别)就是一个很好的关于深度学习的工业应用案例。Face ID可以通过扫描脸部来训练算法。每次使用Face ID登录时,TrueDepth摄像头会捕获数千个数据点,这些数据点被用于创建用户脸部的深度图,而手机的内置神经引擎将执行预测模型以判断您是否是您。

什么是强化学习?

强化学习也是一种自学习系统,但它主要是通过反复试验来学习的。通过有限次地执行行动以得到最大化奖励从而确定最佳答案,换句话说,**它是通过实践来学习,从实践中找到最佳结果。**这就好比我们小时候学骑自行车。刚开始学的时候我们经常会摔倒,但随着摔得次数多了,我们慢慢就掌握窍门了。这个学习的过程就是强化学习。当计算机使用强化学习时,它们会尝试不同的行为,从反馈中学习该行为是否能够得到更好的结果,然后将能得到好结果的行为记住,规范点说就是计算机在多次迭代中自主地重新修正算法,直到能做出正确的判断为止。

使用强化学习的一个很好的例子是让机器人学习如何走路。机器人首先向前迈出一大步然后跌倒。这一大步和摔倒是强化学习系统关注的响应点。由于反馈是负面的,所以继续调整,系统会根据多个负反馈的比对最终确定机器人应该把步子迈的小一点,不停地小,直到机器人走路不会摔倒为止。

近几年,我看到的最强大的强化学习实验之一就是谷歌的Deep Mind。谷歌的研究人员把这个工具应用到了经典的电脑游戏Atari Breakout(一个最经典的打砖块游戏)上。他们把最佳目标(结果)设定成了最多的得分,Deep Mind需要做的就是不断地通过移动底下的挡板来击打小球以破环屏幕顶部的砖块。这个实验的视频大家可以去百度一下,在实验的开始,Deep Mind犯了很多低级错误,但很快,它就可以击败这个世界上最好的击砖块选手了。到现在,Deep Mind已经会玩近60种游戏了。

深度学习与强化学习的区别

深度学习和强化学习首先都是自主学习系统。它们之间的区别在于,深度学习是从训练集中学习,然后将学习到的知识应用于新数据集,是一种静态学习,而强化学习是通过连续的反馈来调整自身的动作以获得最优结果,是一种不断试错的过程,这是动态学习。

有一点需要注意,深度学习和强化学习并不是相互排斥的概念。事实上,您可以在强化学习系统中使用深度学习,这就是深度强化学习。关于深度强化学习的更多内容我会在以后的文章里详细给大家讲解的。

强化学习和深度学习是两种技术,只不过深度学习技术可以用到强化学习上,这个就叫深度强化学习.

1.强化学习其实也是机器学习的一个分支,但是它与我们常见的机器学习不太一样。它讲究在一系列的情景之下,通过多步恰当的决策来达到一个目标,是一种序列多步决策的问题。强化学习是一种标记延迟的监督学习。

2.强化学习实际上是一套很通用的解决人工智能问题的框架,很值得大家去研究。另一方面,深度学习不仅能够为强化学习带来端到端优化的便利,而且使得强化学习不再受限于低维的空间中,极大地拓展了强化学习的使用范围。

参考

https://worktile.com/kb/p/63038

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值