机器学习,深度学习,强化学习,深度强化学习简述

      最近在整理综述,最开始学习的时候,一直对机器学习,深度学习,强化学习,深度强化学习的区别搞不清楚,在这里简单总结一下。这部分简述适合初学者快速了解这几个算法大分类的区别。

      机器学习:可以分为3类:监督学习、无监督学习和强化学习。简单来说,监督学习就是训练的数据有标签,无监督学习就是训练的数据无标签。举个例子,一个小朋友开始学习水果的种类,在苹果上写上苹果2字,西瓜上写上西瓜2字,这就是有标签,那么小朋友在学习的时候就是看着这两个字识别水果的种类,也就是监督学习。如果苹果和西瓜上面没有字,小朋友在学习的时候不会立马就知道苹果和西瓜是什么,他会自己琢磨很久,然后给苹果和西瓜重新起个名字(假如叫大傻和二傻),代表这两种水果的种类,这就是无监督学习。

      深度学习:属于监督学习,又因为其应用的广泛性,大有独立出来和机器学习并列的趋势。

                   区别:机器学习提取特征(特征工程)需要人工解决,深度学习可以自己提取特征,也是主要解决了特征工程的问题。

      强化学习:区别于监督学习和无监督学习的的其中一点也在于数据,监督学习和无监督学习的训练数据都是提前准好的,而强化学习的对象会不断与环境进行交互,在这个过程中不断得到数据。比方说,小朋友认识苹果和西瓜,但这些苹果和西瓜都是我们提前准备好的,这就属于监督学习和无监督学习的数据准备。这个时候小朋友想自己去摘苹果和西瓜了,那么他怎么去摘,这一开时是不知道的,苹果长的高了他要爬树,西瓜在地里,他要蹲下才能采摘,爬树和蹲下就是他摘苹果和西瓜所需要的数据,他每一次接触的树不同,苹果的位置就不同,接触的地不同,西瓜的位置也不同,即便每次都是爬树摘苹果,蹲下摘西瓜,但爬的高度和位置,蹲下的幅度和位置都会不同,这就是小朋友与环境的交互,在这个交互过程中会不断有新数据产生,当产生足够的数据后再去学习就是强化学习。

     深度强化学习:传统的强化学习有个维度灾难问题(知道有个问题就行),为了解决这个问题,将深度学习引入强化学习中,也就有了深度强化学习。

   

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值