机器学习(一)监督学习,非监督学习和强化学习

根据机器学习的应用情况,我们又把机器学习分为三类:监督学习(SupervisedLearning, SL), 非监督学习(Unsupervised learning, UL),和强化学习(Reinforcement Learning, RL)。

1、 监督学习是指原始数据中既有特征值也有标签值的机器学习;(有老师教)

我们把监督学习(SL)要解决的问题分成两类:回归(Regression) 和分类(Classification)

监督学习的算法有很多,而且很多算法已经被收集到成熟的算法库中,使用者可以直接调用。常用的经典算法有:

1.邻近算法(K-Nearest Neighbors, KNN)

2.线形回归( Linear Regression)

3.逻辑回归(Logistic Regression)

4.支持向量机(Support Vector Machine, SVM)

5.朴素贝叶斯分类器 (Naive Bayes)

6.决策树(Decision Tree)

7.随机森林(Random Forests)

8.神经网络(Neural Network):比如卷积神经网络(Convolutional Neural Networks, CNN)和深信度网络(Deep Belief Networks, DBN)

我们准备了一大堆猫和狗的照片,我们想让机器学会如何识别猫和狗。当我们使用监督学习的时候,我们需要给这些照片打上标签。

将打好标签的照片用来训练

我们给照片打的标签就是“正确答案”,机器通过大量学习,就可以学会在新照片中认出猫和狗。

2、非监督学习(UL)要解决的是另外一种问题。我们喂给机器很多特征数据(输入值),是希望机器通过学习找到输入数据中是不是存在某种共性特征,结构(比如都像猫),或者数据特征值之间是不是存在某种关联。而不是像监督学习那样希望预测输出结果。(没老师教)

非监督学习要解决的问题也可以分成两大类:输入数据聚类(Clustering)和输入特征变量关联(Correlation)。

常用的非监督学习算法有:

1.K均值聚类(K-Means Clustering)

2.具有噪声的基于密度的聚类方法(Density-based Spatial Clustering ofApplications with Noise:DBSCAN)

3.主成分分析算法(Principal Component Analysis ,PCA)

4.自组织映射神经网络(Self-Organizing Map, SOM)

5.受限玻尔兹曼机(Restricted Boltzmann Machine, RBM)

我们把一堆猫和狗的照片给机器,不给这些照片打任何标签,但是我们希望机器能够将这些照片分分类。

将不打标签的照片给机器

通过学习,机器会把这些照片分为2类,一类都是猫的照片,一类都是狗的照片。虽然跟上面的监督学习看上去结果差不多,但是有着本质的差别:

非监督学习中,虽然照片分为了猫和狗,但是机器并不知道哪个是猫,哪个是狗。对于机器来说,相当于分成了 A、B 两类。

3、强化学习(RL)不同于监督学习和非监督学习。在强化学习(RL)中没有原始已知数据可以学习。强化学习面对的是一个不断变化的状态空间,要解决的是一个决策链问题。(老师拿着棍子教)

其目的是找到在当前环境(状态空间)下最佳决策是什么。这里的挑战是,当下的决策好坏当下无法验证和评估,要根据多次决策以后才能知道。就像下棋,当前的决策(棋子落点)要在五步十步棋之后才能判断是好是坏。所以强化学习中并没有大量的原始已知输入数据,机器需要在变化的环境中通过大量的多次的试错学习,再根据某种规则找到产生最佳结果的最佳路径,从而做出最佳决策。比较常见的应用有下棋(包括下围棋和象棋)、机器人、自动驾驶等。

总结:

监督学习(SL)中有已知的输入数据和输出数据,相当于看着样本学习。非监督学习中没有输出数据,相当于自己学习。其学习目的是找到输入数据中存在的结构(Structure)和模式(Pattern)。强化学习即没有输入数据也没有输出数据,只有某种规则,相当于试错学习。其目的是在大量可能路径中寻找最佳决策或者路径。

在这里插入图片描述

关于强化学习:

强化学习(Q-Learning,Sarsa)_nakaizura-CSDN博客_强化学习

强化学习入门总结_菜鸟很菜的专栏-CSDN博客_强化学习

强化学习轻松入门 - 知乎

  • 4
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
机器学习可以分为有监督学习、无监督学习强化学习三种类型。 1. 有监督学习(Supervised Learning):有监督学习是指通过给定的标记数据集(即输入和对应的输出)来训练模型。模型通过学习输入与输出之间的映射关系,可以对新的输入进行预测或分类。在有监督学习中,我们知道输入和对应的输出,目标是使模型能够准确地预测或分类未标记的数据。 2. 无监督学习(Unsupervised Learning):无监督学习是指在没有标记数据集的情况下,通过对输入数据的统计特征、相似性或潜在结构进行学习。无监督学习的目标是发现数据中的隐藏模式、结构或关系,常用的任务包括聚类、降维、异常检测等。 3. 强化学习(Reinforcement Learning):强化学习是一种通过试错和反馈来学习如何在一个动态环境中做出决策的机器学习方法。在强化学习中,智能体(Agent)根据当前状态选择动作,并根据环境反馈的奖励或惩罚来调整策略,以最大化长期累积奖励。强化学习适用于需要在复杂、未知环境中做决策的问题,如游戏、机器人控制等。 总结来说,有监督学习需要标记的训练数据,无监督学习不需要标记数据,而强化学习通过与环境的交互来获得奖励或惩罚,以改进决策策略。三种类型的机器学习方法在应用场景和问题解决方面有所不同,适用于不同的任务和需求。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值