11.机器学习基础：机器学习的四个分支

最新推荐文章于 2024-05-01 07:45:00 发布

好名字能更容易让朋友记住

最新推荐文章于 2024-05-01 07:45:00 发布

阅读量1k

点赞数

分类专栏： Python深度学习文章标签：机器学习深度学习

本文链接：https://blog.csdn.net/qq_48981632/article/details/126109956

版权

Python深度学习专栏收录该内容

18 篇文章 0 订阅

订阅专栏

机器学习的四个分支

在前面的例子中，已经熟悉了三种类型的机器学习问题：二分类问题、多分类问题和标量回归问题。这三者都是属于监督学习的例子，其目标是学习训练输入与训练目标之间的关系。

机器学习的四个分支：

监督学习
无监督学习
自监督学习
强化学习

监督学习

给定一组样本（通常由人工标注），它可以学会将输入数据映射到已知目标（也叫标注），如光学字符识别、语音识别、图像分类和语言翻译。虽然监督学习主要包括分类和回归，但还是由更多的奇特变体，主要包括以下几种：

序列生成（sequence generation）。给定一张图像，预测描述图像的文字。序列生成有时可以被重新表示为一系列分类问题，比如反复预测序列中的单词或标记。
语法树预测（syntax tree prediction）。给定一个句子，预测其分解生成的语法树。
目标检测（object detection）。给定一个图像，在图中特定目标的周围画一个边界框。这个问题也可以表示为分类问题（给定多个候选边界框，对每个框内的目标进行分类）或分类与回归联合问题（用向量回归来预测边界框的坐标）。
图像分割（image segmentation）。给定一张图像，在特定物体上画一个像素的掩膜（mask）。

无监督学习

无监督学习是指**在没有目标的情况下寻找输入数据的有趣变换，其目的在于数据可视化、数据压缩、数据去噪或更好地理解数据中的相关性。**无监督学习是数据分析的必备技能，在解决监督学习问题之前，为了更好地了解数据集，它通常是一个必要步骤。**降维（dimensionality reductiuon）和聚类（clustering）**都是卓索州之的无监督学习方法。

自监督学习

自监督学习是监督学习的一种特例，它与众不同。自监督学习是没有人工标注的标签的监督学习，你可以将它看作没有人类参与的监督学习。标签仍然存在（因为总要有什么东西来监督学习过程），但它们是从输入数据中生成的，通常是使用启发式算法生成的。

举例，自编码器（auto encoder）是有名的自监督学习的例子，其生成的目标就是未经修改的输入。同样，给定视频中过去的帧来预测下一帧，或者给定文本中前面的词来预测下一个词，都是自监督学习的例子（这两个例子也属于时序监督学习（temporally sypervised learning，即用未来的输入数据作为监督）。值得注意的是，监督学习、自监督学习和无监督学习之间的区别有时很模糊，这三个类别更像是没有明确界限的连续体。自监督学习可以被重新解释为监督学习或无监督学习，这取决于你关注的是学习机制和应用场景。

强化学习

强化学习一直以来被人们所忽视，但随着Google的DeepMind公司将其成功用于学习玩Atari游戏（以及后来学习下围棋并达到最高水平），机器学习的这一分支开始受到大量关注。在强化学习中，**智能体（agent）**接收有关其环境的信息，并学会选择使某种奖励最大化的行动。例如，神经网络会“观察”视频游戏的屏幕并输出游戏操作，目的是尽可能获得高分，这种神经网络可以通过强化游戏学习来训练。

分类和回顾术语表

样本（sample）或输入（input）：进入模型的数据点。
预测（prediction）或输出（outpu）：从模型出来的结果。
目标（target）：真实值。对于外部数据源，理想情况下，模型应该能够预测出目标。
预测误差（prediction error）或损失值（loss value）：模型预测与目标之间的距离。
类别（class）：分类问题中供选择的一组标签。例如，对猫狗图像进行分类时，“狗”和“猫”就是两个类别。
标签（label）：分类问题中类别标注的具体例子。比如，如果1234号图象被标注为包含类别“狗”，那么“狗”就是1234号图像的标签。
真值（ground-truth）或标注（annotation）：数据集的所有目标，通常由人工收集。
二分类（binary classification）：一种分类任务，每个输入样本都应被划分到两个互斥的类别中。
多分类（multiclass classification）：一种分类任务，每个输入样本都应被划分到两个以上的类别中，比如手写数字分类。
多标签分类（multialabel classification）：一种分类任务，每个输入样本都可以分配多个标签。举例，如果一幅图像里既有猫也有狗，那么应该同时标注“猫”和“狗”标签。每幅图像的标签个数通常是可变的。
标量回归（scalar regression）：目标是连续标量值的任务。预测房价就是一个很好的例子，不同的目标价格形成一个连续的空间。
向量回归（vector regression）：目标是一组连续值（比如一个连续向量）的任务。如果对多个值（比如图像边界框的坐标）进行回归，那就是向量回归。
小批量（mini-batch）或批量（batch）：模型同时处理的一小部分样本（样本数通常为8~128）。样本数通常取2的幂，这样便于CPU上的内存分配。训练时，小批量用来为模型权重计算一次梯度下降更新。