机器学习的三种方法

机器学习三种方法:监督学习(supervised learining)、无监督学习(unsupervised learning)和强化学习(reinforcement learning)

 

 

1.通过监督学习对未来事件进行预测

  

   监督学习的主要目的是使用有类标的训练数据构建模型,我们可以使用经训练得到的模型对未来数据进行预测。此外,术语监督是指训练数据集中的每个样本均有一个已知的输出项(类标(label))

 

a、利用分类对类标进行预测

   分类是监督学习的一个之类,其目的是基于对过往类标已知示例的观察与学习,实现对新样本类标的预测。这些类标是离散的、无序的值,他们可以视为样本的组别信息。

 

b、使用回归预测连续输出值

   另一类监督学习的方法针对连续型输出变量进行预测,也就是所谓的回归分析。在在回归分析中,数据中会给出大量的自变量(解释变量)和相应的连续因变量(输出结果),通过尝试寻找这两种变量之间的关系,就能够预测输出变量。

 

 

2.通过强化学习解决交互式问题

 

   强化学习的目标是构建一个系统(Agent),在与环境(environment)交互的过程中提高系统的性能。环境的当前状态信息中通常包含一个反馈(reward)信号,我们可以将强化学习视为与监督学习相关的一个领域。然而,在强化学习中,这个反馈值不是一个确定的类标或者连续类型的值,而是一个通过反馈函数产生的对当前系统行为的评价。通过与环境的交互,Agent可以通过强化学习来得到一系列的行为,通过探索性的试错或者借助精心设计的激励系统使得正向反馈最大化。

   一个常用的强化学习例子就是象棋对弈的游戏,正此,Agent根据棋盘上的当前局态(环境)决定落子的位置,而游戏结束时胜负的判定可以作为激励信号。

 

 

3.通过无监督学习发现数据本身潜在的结构

 

  通过无监督学习,我们可以在没有已知输出变量和反馈函数指导的情况下提取有效信息来探索数据的整体结构。

 

a、通过聚类发现数据的子群

   聚类是一种探索性数据分析技术。在没有任何相关先验信息的情况下,它可以帮助我们将数据划分为有意义的小的组别(即簇(cluster))。对数据进行分析师,生成的每个簇中其内部成员之间具有一定的相识度,而在其他簇中的成员则具有较大的不同,这也是为什么簇类有时候也被称为“无监督分类”。簇类是获取数据的结构信息,以及导出数据间有价值的关系的一种很好的技术,例如,它使得市场人员可以基于用户的兴趣将其分为不同的类别,以分别制定相应的市场营销计划。

 

 

b、数据压缩中的降维

   数据降维是无监督学习的林一个子领域。通常,我们面对的数据都是高维的(每一次采样都会获得大量的样本值),这就对有限的数据存储空间以及机器学习算法性能提出挑战。无监督降维是数据特征预处理是常用的技术,用于清除数据中的噪声,它能够最大程度保留相关信息的情况下将数据压缩到一个维度较小的子空间,但同时也可能会降低某些算法在准确性方面的性能。


参考书籍:Python机器学习


  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
机器学习(Machine Learning)是一种人工智能的分支,它通过让计算机从数据中学习规律和模式,从而实现一些自动化的任务。机器学习可以分为监督学习、无监督学习和强化学习三种主要方法。 1. 监督学习(Supervised Learning)是指在给定输入和输出数据的情况下,通过训练模型,使其能够预测未知数据的输出结果。监督学习的主要方法包括分类和回归。 - 分类(Classification):将数据分为不同的类别。常用的分类算法有决策树、支持向量机(SVM)、逻辑回归等。 - 回归(Regression):通过建立输入和输出之间的关系,预测连续的数值结果。常用的回归算法有线性回归、多项式回归、岭回归等。 2. 无监督学习(Unsupervised Learning)是指在没有给定输出数据的情况下,通过学习数据本身的结构和特征,进行数据分析和处理。无监督学习的主要方法包括聚类和降维。 - 聚类(Clustering):将数据分为不同的组别。常用的聚类算法有K-means、层次聚类等。 - 降维(Dimensionality Reduction):将高维数据降维到低维空间,保留数据的主要特征。常用的降维算法有主成分分析(PCA)、独立成分分析(ICA)等。 3. 强化学习(Reinforcement Learning)是指通过不断试错和学习,使智能体能够从环境中获取反馈,并根据反馈调整自己的行为,以达到最优化的目标。强化学习常用的算法有Q-learning、策略梯度等。 除了上述三种主要方法外,还有一些其他的机器学习方法,例如半监督学习、迁移学习、深度学习等。这些方法在不同的场景下,具有不同的优势和适用性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值