机器学习类型概述

从不同的视角来看待诸多机器学习算法,有不同的划分。

1、语料视角

根据训练语料对人工参与类别划分或标签标识的需求程度,可将机器学习划分为四种类型: 监督学习、无监督学习、半监督学习、强化学习。

1.1、监督学习 Supervised Learning

在监督学习算法中,提供给算法用于模型训练的数据,其实例的类别或标签是需要人工进行标注的,也即监督二词之所谓。

监督学习算法主要分为两类:分类回归

分类算法通常用于执行分类操作。比如,给一邮件,模型判断该邮件是否是垃圾邮件。

回归算法通常根据数据实例的各种属性值,去预测一个目标数值。比如,给出一辆二手车的一些属性值,比如车龄、里程数、品牌、型号等,模型预测出该二手车所对应的估值交易价格。

常见的监督学习算法如下:

1.2、无监督学习 Unsupervised Learning

在无监督算法中,不需要对训练数据进行类别或标签的标注。

无监督学习主要分为四类:聚类算法、异常点检测算法、可视化及降维算法、关联算法。

聚类算法主要用于对数据实例进行聚合分组。例如,聚类算法可以让我们对网购的消费者进行分类,而不需要人工为算法提供消费者的预定义类型数目。

异常点检测算法主要应用于对异常实例的检测发现。例如,挖掘交易事务流中的异常交易。

可视化及降维算法应用于高维数据的可视化展示、降维优化。例如,我们对二手车价格进行评估时候,其车龄和里程通常是高度正相关的,通过降维算法就可以将这两个特征进行合并,以简化问题的复杂性。特别是当处理大量数据时候,降维算法可以有效节约内存空间、存储空间、计算时间等。

关联算法应用于挖掘实例数据不同属性之间的关联关系。例如,针对网购消费者,通过关联算法可以发现,买了羊蹄和羊肉串的顾客,通常也会买些孜然粉。

1.3、半监督学习 Semisupervised Learning

半监督学习,介于监督学习和无监督学习之间,需要对训练数据的类别和标签,进行部分标注。很多半监督学习是监督学习和无监督学习的组合。

1.4、强化学习 Reinforcement Learning

强化学习,主要基于 “ 行动 + 赏罚 ” 机制。例如走路机器人、DeepMind 的 AlphaGo 等。同上述三种学习机制相比,强化学习是一个明显的另类,单独自居。

   

     

2、训练视角

根据算法是否可以从数据流中进行增量学习,可以将机器学习算法分为批量学习算法、在线学习算法。

2.1、批量学习 Batch Learning

批量学习不支持增量学习。也就是说,如果要进行模型的版本更新,需要将原有训练语料、增量训练语料放在一起,重新训练得一新的模型,来替换旧模型。

比如,批量学习就像铸造铜像一样,现在已有一个较小的铜像,现在想得到一个较大的铜像(版本更新),就需要将较小的铜像、新的铜料,放在一起进行熔化融合,得到一个较大的铜像。

2.2、在线学习 Online Learning

在线学习可以进行增量学习。

比如,在线学习有点像陈年卤煮的卤汁制作一样,经营的过程中,一批批被加入训练的语料类比于盐、胡椒、花椒、桂皮、八角,需要根据业务的需求,增量地加入新语料进行模型更新训练即可,每加入一批次语料,便是一次版本更新。

   

     

3、预测视角

根据模型预测是基于实例数据的直接对比,还是基于实例模式的抽象计算,可以将机器学习算法划分为基于实例学习、基于模型学习。

3.1、基于实例学习 Instance-based Learning

基于实例的学习,通过对比待预测数据、训练数据,两者的相似度,来把更类似于待预测数据的训练数据标签,赋予待预测数据。

比如,西二旗人大多背双肩电脑包,国贸人大多挎个公文包,现在来了一个新人,背双肩电脑包,我们直观地认为他是西二旗人。

3.2、基于模型学习 Model-based Learning

基于模型的学习,不直接对比训练数据、待预测数据。而是基于训练数据,构建一个抽象模型(包括模型选择、模型训练),然后根据该抽象模型的算法偏好,对待预测数据进行分类或标签的设定。

比如,有一堆被标注为狗狗的图片,有一堆被标注为猫猫的图片,现在来了一张新照片,我们不太容易硬编程不同动物之间的差别,也就是说,不太容易直接同已有照片进行硬编程对比。对此,我们通常设计一个简单的卷积神经网络,训练一个二分类模型,来对新照片来进行分类预测。

  • 6
    点赞
  • 44
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值