【机器学习】机器学习、深度学习、强化学习之间的关系

什么是机器学习?

对数据进行较为深入的分析,通过优化方法总结出模型的工作,都属于机器学习范畴
机器学习是从数据中总结模型,而这些数据包含了不同的信息形态,其中一个关键的信息就是对模型表现的反馈信息,有的数据包含了模型应该输出的值,而有的却没有,亦或是有的包含了对模型表现的打分。

因此,按照反馈信息的不同,将其经典划分为三类:

  • 监督学习:处理包含有模型正确输出值的数据,即有标记数据。比如图像识别数据中,每一张图像都有相应分类标记。

  • 无监督学习:数据中完全没有关于模型输出好坏的客观评估。通常会人为的设置某种学习目标,以开展学习。

    例如把256维人脸照片压缩到4维,此时并没有任何关于这4维应该如何的信息,一种做法是使得这4维能够还原出256维的人脸,这就是一种人为设定的目标,这种还原自身信息的做法也叫自监督学习

机器学习和深度学习的相同之处和不同之处?

深度学习也属于机器学习算法之一,它是运用了神经网络作为参数结构进行优化的机器学习算法

二者的区别包含特征和模型两方面:

  • 现在我们所说的机器学习通常指的是传统机器学习算法,如决策树、聚类、贝叶斯分类、SVM等,通常完成任务要经过手工特征提取和分类器判断两个基本步骤,随着数据量的不断增大,手工提取特征的难度也就越来越大,深度学习自己学习特征的优势也就凸显出来了。

  • 区别于传统的浅层学习,深度学习的不同在于:

    1. 强调了模型结构的深度,通常有5层、6层,甚至10多层的隐层节点。
    2. 明确了特征学习的重要性。也就是说,通过逐层特征变换,将样本在原空间的特征表示变换到一个新特征空间,从而使分类或预测更容易(难道原本的机器学习不是特征空间的变换吗?)。与人工规则构造特征的方法相比,利用大数据来学习特征,更能够刻画数据丰富的内在信息。
    3. 除此以外,深度学习模型深度和模型性能基本呈正比关系,在算力廉价化的大背景下,这是明显优势。其它模型如一度很热门的支持向量机,很难通过简单叠硬件来提升性能。

什么是强化学习?

处理的数据仅包含有模型打分值,而不知道模型到底应该输出什么,因此只能靠算法去不断的探索,寻找打分值最高的模型输出。最经典的就是围棋,对每一步而言都没有最佳选择,然而有最终的输赢作为打分,自主探索寻找最佳模型。

可见这一分类,是按照机器学习的任务维度进行划分。当然这样的划分并不具有完全清晰的边界。

强化学习的训练是没有标签的,它是通过环境给出的奖惩来学习,因此应该算是一种无监督学习。

强化学习和深度学习一样,也是机器学习算法之一,不仅能利用现有数据,还可以通过对环境的探索获得新数据,并利用新数据循环往复地更新迭代现有模型的机器学习算法。

(深度学习的学习过程是静态的,强化学习的学习过程是动态的。这里静态与动态的区别在于是否会与环境进行交互,深度学习是给什么样本就学什么,而强化学习是要和环境进行交互,再通过环境给出的奖惩来学习。深度学习解决的更多是感知问题,强化学习解决的主要是决策问题。因此有监督学习更像是五官,而强化学习更像大脑。)

  • 3
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值