有监督学习、无监督学习、强化学习

有监督学习的主要目标是从有标签的训练数据中学习模型,以便对未知或未来的数据做出预测。
监督:已经知道样本所需要的输出信号或标签。

以垃圾邮件过滤为例,可以采用有监督的机器学习算法,基于打过标签的电子邮件语料库来训练模型,然后用模型来预测新邮件是否属于垃圾邮件。
带有离散分类标签的有监督学习——分类任务,例如垃圾邮件过滤

有监督学习的另一个子类被称为回归,其结果信号是连续的数值。

预测标签的分类

分类是有监督学习的一个分支,其目的是根据过去的观测结果来预测新样本的分类标签。
分类标签是离散的无序值。
邮件垃圾检测是典型的二元分类任务。

多元分类任务的典型例子:识别手写字符。
首先,收集包含字母表中所有字母的多个手写示例形成训练集。
当用户通过输入设备提供一个新的手写字符时,预测模型能够准确地将其识别为字母表中的正确字母。

预测连续结果的回归

对连续结果的预测,也称为回归分析。
回归分析包括一些预测变量和一个连续的响应变量,试图寻找那些能够预测结果的变量之间的关系。

用强化学习解决交互问题

强化学习的目标是开发系统或代理
通过它们与环境的交互来提高其预测性能
当前环境状态的信息通常包含所谓的奖励信号,可以把强化学习看做是有监督学习相关的领域,然而强化学习的反馈并非标定过的正确标签或数值,而是奖励函数对行动的度量。
代理可以与环境交互完成强化学习,通过探索性的试错或深思熟虑的规划来最大化这种奖励。

强化学习的常见例子是国际象棋。
代理根据棋盘的状态或环境来决定一系列的行动,奖励为比赛结果的输赢。

在有监督学习中训练模型,事先知道正确的答案
在强化学习过程中,定义了代理对特定动作的奖励
然而无监督学习处理的是无标签或结构未知的数据。
使用无监督学习技术,可以在没有已知结果变量或奖励函数的指导下,探索数据结构以提取有意义的信息。

寻找聚类的子集

聚类是探索性的数据分析技术,可以在事先不了解组员的情况下,将信息分层有意义的组群。为在分析过程中出现的每个群定义一组对象,它们之间都有一定程度的相似性,但与其它群中对象的差异性很大。
聚类是构造信息和从数据中导出有意义关系的一种有用的技术,它允许营销人员根据自己的兴趣发现客户群,以便订制不同的市场营销计划。

通过降维压缩数据

无监督学习的另一个子类是降维。
高维数据的每个观察都伴随着大量测量数据,这对有限的存储空间和机器学习算法的计算性能提出了挑战。
无监督降维是特征预处理中数据去噪的一种常用方法,它也降低了某些算法对预测性能的要求,并在保留大部分相关信息的同时将数据压缩到较小维数的子空间上。

降维有利于数据的可视化,为了通过二维或三维散点图或直方图实现数据的可视化,可以把高维特征数据集投影到一、二或三维特征空间。

基本术语与符号

鸢尾属植物数据集
数据集中每行代表一朵花的样本数据,每种花的数据按列存储,称为特征数据集。
每个样本为特征矩阵X的一行,每个特征表示为一列。
上标i指第i个训练样本,下标j表示训练数据集的维度。

构建机器学习系统的路线图

预处理——整理数据
许多机器学习算法要求所选择特征的测量结果具有相同的单位,以获取最佳性能——通常通过把特征数据变换为[0,1]的取值范围或者均值和单位方差为0的标准正态分布来实现。

某些选定的特征可能是高度相关的,因此在某种程度上是多余的。
在这种情况下,降维技术对于将特征压缩到低维子空间非常有价值。
降低特征空间维数的优点是减少存储空间,提高算法运行的速度。
如果数据集包含大量不相关的特征或噪声,即数据集有较低的信噪比,降维也可以提高模型预测的性能。

训练和选择预测模型

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

饼干饼干圆又圆

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值