机器学习，深度学习，强化学习，深度强化学习简述

笑傲江湖2023

已于 2023-07-24 11:43:05 修改

阅读量277

点赞数

文章标签：机器学习深度学习人工智能

于 2023-07-17 20:35:18 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_48878618/article/details/131773906

版权

最近在整理综述，最开始学习的时候，一直对机器学习，深度学习，强化学习，深度强化学习的区别搞不清楚，在这里简单总结一下。这部分简述适合初学者快速了解这几个算法大分类的区别。

机器学习：可以分为3类：监督学习、无监督学习和强化学习。简单来说，监督学习就是训练的数据有标签，无监督学习就是训练的数据无标签。举个例子，一个小朋友开始学习水果的种类，在苹果上写上苹果2字，西瓜上写上西瓜2字，这就是有标签，那么小朋友在学习的时候就是看着这两个字识别水果的种类，也就是监督学习。如果苹果和西瓜上面没有字，小朋友在学习的时候不会立马就知道苹果和西瓜是什么，他会自己琢磨很久，然后给苹果和西瓜重新起个名字（假如叫大傻和二傻），代表这两种水果的种类，这就是无监督学习。

深度学习：属于监督学习，又因为其应用的广泛性，大有独立出来和机器学习并列的趋势。

区别：机器学习提取特征（特征工程）需要人工解决，深度学习可以自己提取特征，也是主要解决了特征工程的问题。

强化学习：区别于监督学习和无监督学习的的其中一点也在于数据，监督学习和无监督学习的训练数据都是提前准好的，而强化学习的对象会不断与环境进行交互，在这个过程中不断得到数据。比方说，小朋友认识苹果和西瓜，但这些苹果和西瓜都是我们提前准备好的，这就属于监督学习和无监督学习的数据准备。这个时候小朋友想自己去摘苹果和西瓜了，那么他怎么去摘，这一开时是不知道的，苹果长的高了他要爬树，西瓜在地里，他要蹲下才能采摘，爬树和蹲下就是他摘苹果和西瓜所需要的数据，他每一次接触的树不同，苹果的位置就不同，接触的地不同，西瓜的位置也不同，即便每次都是爬树摘苹果，蹲下摘西瓜，但爬的高度和位置，蹲下的幅度和位置都会不同，这就是小朋友与环境的交互，在这个交互过程中会不断有新数据产生，当产生足够的数据后再去学习就是强化学习。

深度强化学习：传统的强化学习有个维度灾难问题（知道有个问题就行），为了解决这个问题，将深度学习引入强化学习中，也就有了深度强化学习。

笑傲江湖2023

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
机器学习，深度学习，强化学习，深度强化学习简述

这个时候小朋友想自己去摘苹果和西瓜了，那么他怎么去摘，这一开时是不知道的，苹果长的高了他要爬树，西瓜在地里，他要蹲下才能采摘，爬树和蹲下就是他摘苹果和西瓜所需要的数据，他每一次接触的树不同，苹果的位置就不同，接触的地不同，西瓜的位置也不同，即便每次都是爬树摘苹果，蹲下摘西瓜，但爬的高度和位置，蹲下的幅度和位置都会不同，这就是小朋友与环境的交互，在这个交互过程中会不断有新数据产生，当产生足够的数据后再去学习就是强化学习。简单来说，监督学习就是训练的数据有标签，无监督学习就是训练的数据无标签。
复制链接

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。