监督、半监督、无监督学习和深度、强化和迁移学习

一、监督、半监督、无监督学习

1.1、监督学习(Supervised learning)

监督学习是指:利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程。

在监督学习中训练数据既有特征(feature)又有标签(label),通过训练,机器可以通过给定数据,预测标签。
监督学习的分类:回归(Regression)和分类(Classification);
回归问题是针对于连续型变量的,例如预测房屋价格;
分类是针对离散型数据的,输出结果是有限的,比如判断好瓜坏瓜。

1.2、半监督学习(Semi-Supervised learning)

半监督学习是监督学习和无监督学习相结合的一种学习方法,它使用大量的未标记数据,以及同时使用标记数据,来进行模式识别工作。

当使用半监督学习时,将会要求尽量少的人员来从事工作,同时,又能够带来比较高的准确性。

主动学习的模型如下:
A=(C,Q,S,L,U)
其中C指的是一个或者多个分类器,Q指的是一些查询函数,也就是一些查询算法,S指的是监督者,通常指的是专家,L是少量标记的样本,U指的是大量未被标记的样本。
学习者利用少量标记样本L,通过机器学习算法学习一个或者多个机器学习模型C,然后通过查询算法,查询出一批最有用的样本,交给专家,让专家进行标记,最后将新学到的标记数据加入到少量样本中,继续训练模型。一直循环,直到达到一个准则为止。
在这里插入图片描述
参考https://blog.csdn.net/yuanlong_great/article/details/79644620

1.3、无监督学习(Unsupervised Learning)

根据类别未知(没有被标记)的训练样本解决模式识别中的各种问题,称为无监督学习。

(1)缺乏足够的先验知识,因此难以人工标注类别;
(2)进行人工类别标注的成本太高

数据只有特征,没有标签。
给定数据,让机器寻找隐藏的结构,换句话说就是直接对数据集建模。
无监督学习解决的主要是聚类(Clustering)问题,代表算法:
(1)K均值(K-Means)算法;
(2)自编码器(Auto-Encoder);
(3)主成分分析(Principle Component Analysis)。

参考1 https://www.aiyingli.com/59488.html
参考2 https://blog.csdn.net/YUANLONG_GREAT/article/details/79644620

二、深度、强化和迁移学习

原文链接 https://blog.csdn.net/jiandanjinxin/article/details/54133521

2.1、深度学习(Deep Learning,DL)

基于卷积神经网络的深度学习(包括CNN,RNN),主要解决的领域是图像、文本、语音,问题题聚焦在分类、回归。

深度学习的局限性:
(1)表达能力的限制:深度学习的变量和深度都是有限的,对于现实世界来说,深度学习来描述数据的复杂度还不够复杂;深度学习对数据的需求量随着模型的增大而增大,但现实中有那么多高质量数据的情况还不多。
(2)缺乏反馈机制:目前深度学习对图像识别、语音识别等问题来说是最好的,但是对其他问题不是最好的,特别是有延迟反馈的问题,例如机器人的行动。

2.2、强化学习(Reinforcement Learning,RL)

强化学习,又称再励学习、评价学习或增强学习。

强化学习是智能体(Agent)以“试错”的方式进行学习,通过与环境进行交互获得的奖赏指导行为,目标是使智能体获得最大的奖赏。
在这里插入图片描述

强化学习不同于连接主义学习中的监督学习,主要表现在强化信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号),而不是告诉强化系统RLS(reinforcement learning system)如何去产生正确的动作。
参考1

2.3、迁移学习(Tranfer Learning,TL)

所谓迁移学习,或者领域适应(Domain Adaptation),一般就是要将从源领域(Source Domain)学习到的东西应用到目标领域(Target Domain)上去。源领域和目标领域之间往往有gap/domain discrepancy。

迁移学习的四种方法:
1、样本迁移(Instance-based Transfer Learning)
一般是对样本进行加权,给比较重要的样本较大的权重。
样本迁移即在数据集(源领域)中找到与目标领域相似的数据,把这个数据放大多倍,与目标领域的数据进行匹配。其特点是:需要对不同例子加权;需要用数据进行训练。
2、特征迁移(Feature-based Transfer Learning)
3、模型迁移(Model-based Transfer Learning)
整个模型应用到目标领域去,比如目前常用的对预训练好的深度网络做微调,也可以叫参数迁移。
4、关系迁移(Relational Transfer Learning)
社会网络,社交网络之间的迁移,比如师生关系迁移到上下级关系,生物病毒传播迁移到网络病毒传播。

总结:机器学习的昨天,今天和明天
昨天:深度学习:大量数据,特征,准确性
今天:强化学习:大量数据,反馈,策略
明天:少量数据:学习方法,冷启动、个性化

  • 4
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值