【机器学习】机器学习、深度学习、强化学习之间的关系

最新推荐文章于 2024-06-29 22:51:21 发布

Lies.

最新推荐文章于 2024-06-29 22:51:21 发布

阅读量1.5k

点赞数 3

分类专栏：机器学习文章标签：机器学习深度学习人工智能

本文链接：https://blog.csdn.net/weixin_46564151/article/details/129352176

版权

机器学习专栏收录该内容

9 篇文章 4 订阅

订阅专栏

什么是机器学习？

对数据进行较为深入的分析，通过优化方法总结出模型的工作，都属于机器学习范畴
机器学习是从数据中总结模型，而这些数据包含了不同的信息形态，其中一个关键的信息就是对模型表现的反馈信息，有的数据包含了模型应该输出的值，而有的却没有，亦或是有的包含了对模型表现的打分。

因此，按照反馈信息的不同，将其经典划分为三类：

监督学习：处理包含有模型正确输出值的数据，即有标记数据。比如图像识别数据中，每一张图像都有相应分类标记。
无监督学习：数据中完全没有关于模型输出好坏的客观评估。通常会人为的设置某种学习目标，以开展学习。

例如把256维人脸照片压缩到4维，此时并没有任何关于这4维应该如何的信息，一种做法是使得这4维能够还原出256维的人脸，这就是一种人为设定的目标，这种还原自身信息的做法也叫自监督学习。

机器学习和深度学习的相同之处和不同之处？

深度学习也属于机器学习算法之一，它是运用了神经网络作为参数结构进行优化的机器学习算法

二者的区别包含特征和模型两方面：

现在我们所说的机器学习通常指的是传统机器学习算法，如决策树、聚类、贝叶斯分类、SVM等，通常完成任务要经过手工特征提取和分类器判断两个基本步骤，随着数据量的不断增大，手工提取特征的难度也就越来越大，深度学习自己学习特征的优势也就凸显出来了。
区别于传统的浅层学习，深度学习的不同在于：
1. 强调了模型结构的深度，通常有5层、6层，甚至10多层的隐层节点。
2. 明确了特征学习的重要性。也就是说，通过逐层特征变换，将样本在原空间的特征表示变换到一个新特征空间，从而使分类或预测更容易（难道原本的机器学习不是特征空间的变换吗？）。与人工规则构造特征的方法相比，利用大数据来学习特征，更能够刻画数据丰富的内在信息。
3. 除此以外，深度学习模型深度和模型性能基本呈正比关系，在算力廉价化的大背景下，这是明显优势。其它模型如一度很热门的支持向量机，很难通过简单叠硬件来提升性能。

什么是强化学习？

处理的数据仅包含有模型打分值，而不知道模型到底应该输出什么，因此只能靠算法去不断的探索，寻找打分值最高的模型输出。最经典的就是围棋，对每一步而言都没有最佳选择，然而有最终的输赢作为打分，自主探索寻找最佳模型。

可见这一分类，是按照机器学习的任务维度进行划分。当然这样的划分并不具有完全清晰的边界。

强化学习的训练是没有标签的，它是通过环境给出的奖惩来学习，因此应该算是一种无监督学习。

强化学习和深度学习一样，也是机器学习算法之一，不仅能利用现有数据，还可以通过对环境的探索获得新数据，并利用新数据循环往复地更新迭代现有模型的机器学习算法。

（深度学习的学习过程是静态的，强化学习的学习过程是动态的。这里静态与动态的区别在于是否会与环境进行交互，深度学习是给什么样本就学什么，而强化学习是要和环境进行交互，再通过环境给出的奖惩来学习。深度学习解决的更多是感知问题，强化学习解决的主要是决策问题。因此有监督学习更像是五官，而强化学习更像大脑。）