机器学习系统分类

机器学习系统的类型

根据常见规则进行分类:

  • 是否在人工监督下进行训练:监督学习(Supervised Learning)、非监督(Unsupervised Learning)、半监督学习(Semisupervised Learning)、强化学习(Reinforcement Learning)
  • 是否可以动态渐进学习:在线学习(Online Learning) vs 批量学习(Batch Learning)
  • 是否通过简单地比较新的数据点和已知数据点,或者在训练中进行模式识别:基于实例学习(Instance-based Learning) vs 基于模型学习(Model-based Learning)

监督/非监督学习

区别:有没有告诉你答案?

监督学习

在监督学习中,用来训练算法的训练集包含了答案,也称为标签。

监督学习
监督学习

典型的监督学习任务是分类。 垃圾邮件过滤器就是一个很好的例子: 用许多带有归类(垃圾邮件或普通邮件) 的邮件样本进行训练, 过滤器必须还能对新邮件进行分类。

常见的监督学习算法:

  • K近邻算法
  • 线性回归(Linear Regression)
  • 逻辑回归(Logistic Regression)
  • 支持向量机(Support Vector Machines,SVMs)
  • 决策树和随机森林(Decision Trees and Random Forests)
  • 神经网络(Neural network)

非监督学习

在非监督学习中,训练集是没有给出答案或者标签,是在没有人工规定条件下进行学习。

非监督学习
非监督学习

常见非监督学习算法:

  1. 聚类

K均值

层次聚类分析(Hierarchical Cluster Analysis, HCA)

期望最大值

  1. 可视化和降维

主成分分析( Principal Component Analysis, PCA)

核主成分分析

局部线性嵌入( Locally-Linear Embedding, LLE)

t-分布邻域嵌入算法( t-distributed Stochastic Neighbor Embedding, t-SNE)

  1. 关联性规则学习

Apriori 算法

Eclat 算法

半监督学习

一些算法可以处理部分带标签的训练数据, 通常是大量不带标签数据加上小部分带标签数
据。 这称作半监督学习。

半监督学习
半监督学习

多数半监督学习算法是非监督和监督算法的结合。 例如, 深度信念网络( deep beliefnetworks) 是基于被称为互相叠加的受限玻尔兹曼机( restricted Boltzmann machines,RBM) 的非监督组件。 RBM 是先用非监督方法进行训练, 再用监督学习方法进行整个系统微调。

强化学习

强化学习非常不同。学习系统在这里被称为智能体(agent),可以对环境进行观察,选择和执行动作,获得奖励(负奖励是惩罚) 。 然后它必须自己学习哪个是最佳方法(称为策略, policy),以得到长久的最大奖励。策略决定了智能体在给定情况下应该采取的行动。

强化学习
强化学习
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值