林轩田之机器学习课程笔记(when can machines learn之types of learning)(32之3)

欢迎转载,可以关注博客:http://blog.csdn.net/cqy_chen

概要

本课程主要讲解各式各样的机器学习类型,机器学习不仅仅可以解决是非问题,这个我们称为二分问题。

不同输出空间Y的学习类型

根据输出空间的不同,我们可以将机器学习分为:
1)二元分类问题,这是一个非常重要的问题。很多情况我们都是采用二元分类,如上节课讲的是否发信用卡。
2)多元分类问题,这个是二元分类的延伸,就犹如二项分布和多项分布得关系。比如图像识别,要识别是猫,狗,人还是其他的等等。
3)回归问题,这个时候输出值不再是输出离散的值,而是输出连续值。比如预测房价,预测天气气温,预测交通流量大小等。
4)结构化学习,如序列话的标注问题,在自然语言处理中,需要标注一句话的词性,输入是一句话,输出是这句话的每个词的词性序列。这些可以从多类问题的延伸问题。

这里的核心问题是:二分类问题和回归问题。
这里只是列举了四个常见的学习问题,还有其他的一些。

不同的数据标签 yn 的学习类型

根据是否给出标签,我们可以分为:
1)监督学习:比如给出一堆铜板,同时给出每个铜板的面额,现在需要判断新的一个铜板是哪一个面额。这样的问题是一个监督问题,就像有一个老师在旁边说标准答案。大部分问题都是监督学习。是机器学习的核心。

2)无监督学习:同样是一堆铜板,需要分成几堆。或者给定一堆文章,分成不同的主题,如LDA。没有给定文章是哪个主题,这样的问题就是无监督问题。现在采比较多的是,聚类,比如密度聚类

3)半监督学习:这个就是一部分资料有标签,一部分没有标签,比如图像的标记,很多是人工的标记,但是大部分没有标记的。人工标记是很困难的情况一般采用半监督学习。

这里写图片描述

4)强化学习:这是一个非常自然但不同的学习方式,比如训练宠物。我们可以通过惩罚来训练宠物。In reinforcement learning, the output is an action or sequence of actions and the only supervisory signal is an occasional scalar reward
不是直接的告诉宠物怎么做,而是根据宠物做的情况来进行判断,奖励还是惩罚。 比如线上广告系统,怎么来放广告,如果用户反映好,就ok,如果不好,就切换。这样系统就学习到了怎么来满足用户的广告需求。

这些机器学习方法都是根据标记来区分的。就像强化学习是通过判断标记,进而给出奖励还是惩罚。

不同的函数 f 的学习类型

1)批学习:比如给算法一堆数据,得到一个模型,然后拿去使用。这是机器学习中最常见的方式。数据是成批的学习。

2)在线学习:数据是不断的给,模型不断的变更。比如在线的垃圾邮件判断系统。每次选取一个邮件,然后训练模型,然后不断的选取。强化学习一般都采用在线学习,因为强化学习需要不断的给出反馈来训练模型。一般在线学习中标签或者反馈能够更快的给出的地方。

3)主动学习:通过机器学习不断的给出反馈来调整模型。就像教学生,现在不是直接给一堆资料给学生拿去学习,而是让学生提问的方式来学习,一般也采用在线学习的方式。
通常用在标记很贵的地方,比如药物疗效的反馈。

不同输入空间x的学习类型

上面都是根据输出的标记来判断各种学习方法,这里通过输入的情况来区分学习类型。

1)具体的特征:带有人类的的思维的特征,比如信用卡是否发放。申请人的身高、年龄等都是一些具体的特征。

2)原始的特征:比如图形图像的识别,给定一张图片如何提取特征呢?比如我们可以提取图片的对称性,密度,这些都是具体的特征,带有人类的智慧。同时也可以认为这些图片就是一些像素组成的矩阵。比如是1600*900的一张像素图片。
一般原始的特征需要通过人类的智慧或者深度学习的方式来抽取特征,然后才进一步的学习。
这里顺便说一下,深度学习和传统的机器学习显著的差异就是特征提取是否自动化。

3)抽象特征:有的时候特征是很抽象的,比如用户的id,比如一个用户给一个电影id打分。这些id都是很抽象的。没有特定的物理意义。

欢迎转载,可以关注博客:http://blog.csdn.net/cqy_chen

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值