机器学习三大方法解析-CSDN博客

本文链接：https://blog.csdn.net/m0_37611893/article/details/80230058

机器学习三种方法：监督学习（supervised learining）、无监督学习（unsupervised learning）和强化学习（reinforcement learning）

1.通过监督学习对未来事件进行预测

监督学习的主要目的是使用有类标的训练数据构建模型，我们可以使用经训练得到的模型对未来数据进行预测。此外，术语监督是指训练数据集中的每个样本均有一个已知的输出项（类标（label））

a、利用分类对类标进行预测

分类是监督学习的一个之类，其目的是基于对过往类标已知示例的观察与学习，实现对新样本类标的预测。这些类标是离散的、无序的值，他们可以视为样本的组别信息。

b、使用回归预测连续输出值

另一类监督学习的方法针对连续型输出变量进行预测，也就是所谓的回归分析。在在回归分析中，数据中会给出大量的自变量（解释变量）和相应的连续因变量（输出结果），通过尝试寻找这两种变量之间的关系，就能够预测输出变量。

2.通过强化学习解决交互式问题

强化学习的目标是构建一个系统（Agent），在与环境（environment）交互的过程中提高系统的性能。环境的当前状态信息中通常包含一个反馈（reward）信号，我们可以将强化学习视为与监督学习相关的一个领域。然而，在强化学习中，这个反馈值不是一个确定的类标或者连续类型的值，而是一个通过反馈函数产生的对当前系统行为的评价。通过与环境的交互，Agent可以通过强化学习来得到一系列的行为，通过探索性的试错或者借助精心设计的激励系统使得正向反馈最大化。

一个常用的强化学习例子就是象棋对弈的游戏，正此，Agent根据棋盘上的当前局态（环境）决定落子的位置，而游戏结束时胜负的判定可以作为激励信号。

3.通过无监督学习发现数据本身潜在的结构

通过无监督学习，我们可以在没有已知输出变量和反馈函数指导的情况下提取有效信息来探索数据的整体结构。

a、通过聚类发现数据的子群

聚类是一种探索性数据分析技术。在没有任何相关先验信息的情况下，它可以帮助我们将数据划分为有意义的小的组别（即簇（cluster））。对数据进行分析师，生成的每个簇中其内部成员之间具有一定的相识度，而在其他簇中的成员则具有较大的不同，这也是为什么簇类有时候也被称为“无监督分类”。簇类是获取数据的结构信息，以及导出数据间有价值的关系的一种很好的技术，例如，它使得市场人员可以基于用户的兴趣将其分为不同的类别，以分别制定相应的市场营销计划。

b、数据压缩中的降维

数据降维是无监督学习的林一个子领域。通常，我们面对的数据都是高维的（每一次采样都会获得大量的样本值），这就对有限的数据存储空间以及机器学习算法性能提出挑战。无监督降维是数据特征预处理是常用的技术，用于清除数据中的噪声，它能够最大程度保留相关信息的情况下将数据压缩到一个维度较小的子空间，但同时也可能会降低某些算法在准确性方面的性能。

参考书籍：Python机器学习