有监督学习、无监督学习、强化学习

最新推荐文章于 2023-06-20 21:58:56 发布

饼干饼干圆又圆

最新推荐文章于 2023-06-20 21:58:56 发布

阅读量2.4k

点赞数 1

本文链接：https://blog.csdn.net/Caramel_biscuit/article/details/118456023

版权

有监督学习的主要目标是从有标签的训练数据中学习模型，以便对未知或未来的数据做出预测。
监督：已经知道样本所需要的输出信号或标签。

以垃圾邮件过滤为例，可以采用有监督的机器学习算法，基于打过标签的电子邮件语料库来训练模型，然后用模型来预测新邮件是否属于垃圾邮件。
带有离散分类标签的有监督学习——分类任务，例如垃圾邮件过滤

有监督学习的另一个子类被称为回归，其结果信号是连续的数值。

预测标签的分类

分类是有监督学习的一个分支，其目的是根据过去的观测结果来预测新样本的分类标签。
分类标签是离散的无序值。
邮件垃圾检测是典型的二元分类任务。

多元分类任务的典型例子：识别手写字符。
首先，收集包含字母表中所有字母的多个手写示例形成训练集。
当用户通过输入设备提供一个新的手写字符时，预测模型能够准确地将其识别为字母表中的正确字母。

预测连续结果的回归

对连续结果的预测，也称为回归分析。
回归分析包括一些预测变量和一个连续的响应变量，试图寻找那些能够预测结果的变量之间的关系。

用强化学习解决交互问题

强化学习的目标是开发系统或代理
通过它们与环境的交互来提高其预测性能
当前环境状态的信息通常包含所谓的奖励信号，可以把强化学习看做是有监督学习相关的领域，然而强化学习的反馈并非标定过的正确标签或数值，而是奖励函数对行动的度量。
代理可以与环境交互完成强化学习，通过探索性的试错或深思熟虑的规划来最大化这种奖励。

强化学习的常见例子是国际象棋。
代理根据棋盘的状态或环境来决定一系列的行动，奖励为比赛结果的输赢。

在有监督学习中训练模型，事先知道正确的答案
在强化学习过程中，定义了代理对特定动作的奖励
然而无监督学习处理的是无标签或结构未知的数据。
使用无监督学习技术，可以在没有已知结果变量或奖励函数的指导下，探索数据结构以提取有意义的信息。

寻找聚类的子集

聚类是探索性的数据分析技术，可以在事先不了解组员的情况下，将信息分层有意义的组群。为在分析过程中出现的每个群定义一组对象，它们之间都有一定程度的相似性，但与其它群中对象的差异性很大。
聚类是构造信息和从数据中导出有意义关系的一种有用的技术，它允许营销人员根据自己的兴趣发现客户群，以便订制不同的市场营销计划。

通过降维压缩数据

无监督学习的另一个子类是降维。
高维数据的每个观察都伴随着大量测量数据，这对有限的存储空间和机器学习算法的计算性能提出了挑战。
无监督降维是特征预处理中数据去噪的一种常用方法，它也降低了某些算法对预测性能的要求，并在保留大部分相关信息的同时将数据压缩到较小维数的子空间上。

降维有利于数据的可视化，为了通过二维或三维散点图或直方图实现数据的可视化，可以把高维特征数据集投影到一、二或三维特征空间。

基本术语与符号

鸢尾属植物数据集
数据集中每行代表一朵花的样本数据，每种花的数据按列存储，称为特征数据集。
每个样本为特征矩阵X的一行，每个特征表示为一列。
上标i指第i个训练样本，下标j表示训练数据集的维度。

构建机器学习系统的路线图

预处理——整理数据
许多机器学习算法要求所选择特征的测量结果具有相同的单位，以获取最佳性能——通常通过把特征数据变换为[0,1]的取值范围或者均值和单位方差为0的标准正态分布来实现。

某些选定的特征可能是高度相关的，因此在某种程度上是多余的。
在这种情况下，降维技术对于将特征压缩到低维子空间非常有价值。
降低特征空间维数的优点是减少存储空间，提高算法运行的速度。
如果数据集包含大量不相关的特征或噪声，即数据集有较低的信噪比，降维也可以提高模型预测的性能。

训练和选择预测模型

饼干饼干圆又圆

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
有监督学习、无监督学习、强化学习

有监督学习的主要目标是从有标签的训练数据中学习模型，以便对未知或未来的数据做出预测。监督：已经知道样本所需要的输出信号或标签。以垃圾邮件过滤为例，可以采用有监督的机器学习算法，基于打过标签的电子邮件语料库来训练模型，然后用模型来预测新邮件是否属于垃圾邮件。带有离散分类标签的有监督学习——分类任务，例如垃圾邮件过滤有监督学习的另一个子类被称为回归，其结果信号是连续的数值。预测标签的分类分类是有监督学习的一个分支，其目的是根据过去的观测结果来预测新样本的分类标签。分类标签是离散的无序值。邮件垃圾
复制链接

扫一扫