李宏毅《机器学习》Introduction

A. AI/机器学习/深度学习

AI是目的,机器学习是手段,深度学习是机器学习其中一种方法

B.机器学习是什么?

C.Learning path

 

 C1 监督学习:

INPUT :大量资料

OUTPUT: 人工标注 (label)

C11任务:

回归/分类/结构化学习

分类:下围棋,可以看作十九乘十九个类别的分类问题

结构化学习:OUTPUT:结构性的对象(比如句子/分辨图片的结构)

C12 模型:

线性模型/非线性模型

非线性:SVM / deep learning/ decision tree/...

C2 半监督学习

OUTPUT 既有labelled 又有 unlabeled (对学习也可能有用)

C3 迁移学习

OUTPUT 既有labelled 又有 unlabeled 以及其他不相干资料 (对学习也可能有用)

C4 无监督学习

INPUT :大量资料

OUTPUT: 无

C5 强化学习

VS监督学习(训练过程中):INPUT,  OUTPUT:正确答案

强化学习(训练过程中):INPUT,OUTPUT:分数(做的好/不好)

若我们用Alpha Go当做例子时,supervised learning就是告诉机器:看到这个盘式你就下“5-5”,看到这个盘式你就下“3-3”

reinforcement learning的意思是:机器跟对手互下,机器会不断的下棋,最后赢了,机器就会知道下的不错,但是究竟是哪里可以使它赢,它其实是不知道的。我们知道Alpha Go其实是用监督学习加上reinforcement learning去学习的。先用棋谱做监督学习,然后在做reinforcement learning,但是reinforcement learning需要一个对手,如果使用人当对手就会很让费时间,所以机器的对手是另外一个机器。

图片,资料来自李宏毅《机器学习》

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值