李宏毅机器学习笔记 DAY1

一、机器学习介绍

人工智慧(目标):使机器像人一样拥有智慧。

机器学习machine learning(方法):让机器具有学习的能力,其中深度学习是机器学习中的一种方法。

DO:让机器通过人所给的资料,寻找到一个解决问题的function。

语音辨识:输入声音——输出文字

影像辨识:输入图片——输出图片内的内容

学习过程(Training)

Machine learning framework分为三个步骤:

1.Model:也就是function set(集合),包含众多function(f1,f2,f3…),从中找到一个function

2.TRAINING DATA(训练资料):告诉机器一个合适的function的输入和输出和两者的关系,让其判断function的好坏。

其中告诉机器Input和Output叫做Supervised Learning(监督学习)

3.通过有效的演算法,从function set中挑选出“Best”Function —— f*

二、监督学习(Supervised Learning)

监督学习需要大量的training data。从training data中可以知道function的input和output之间的关系。

在监督学习下进行学习,需要告诉机器function的input和output是什么。这个output往往需要人工标注,叫做label。

1.Regression(回归)是一种machine learning的task,做regression的意思是使machine需要的function的输出是一个scalar(标量数值),这个叫做regression。

2.Classification(分类),在Classification里机器输出的是类别。

Classification问题分成两种:二分类输出的是Yes or No;多分类(Multi-class)是给机器无数个选项,每个选项都是一个类别,让机器从这些类别里选择正确的类别。

Model有很多种,最简单的就是线性模型,但我们会花很多时间在非线性的模型上。在非线性的模型中最耳熟能详的就是Deep learning。比如它可以做影像辨识,让机器下围棋(分类)

监督学习中的结构化学习(structured learning)

structured learning 让机器输出的是要有结构性的。

语音辨识:机器输入是声音讯号,输出是一个句子,句子由词汇组成。

机器翻译:输入中文句子翻译成英文句子输出。

人脸辨识:输入图片,人物在图片中的不同位置。需要机器标注出来。

三、半监督学习((Semi-Supervised Learning

减少label需要的量

没有label的data,他可能也是对学习有帮助

四、迁移学习(Transfer learning)

减少data量的方向。

迁移学习:做分类问题,只有少量有label的data,还有大量可能有label也可能无label的data,也就是有很多不相关的图片。

五、无监督学习(Unsupervised Learning)

在完全没有任何label的情况下,到底机器可以学到什么样的事情。

六、强化学习(reinforcement learning)

监督学习:告诉机器正确答案是什么。

强化学习:没有告诉机器正确的答案是什么,机器所拥有的只有一个分数,就是他做的好还是不好。它要回去反省检讨哪一步做的不好。

例:Alpha Go

监督学习:告诉机器,看到什么盘下什么。

强化学习:机器跟对手互下,不断的下棋,最后赢了,机器就会知道做的好,没赢,就是做的不好,再进行学习的过程。

总结:

学习情景:监督学习,半监督学习,无监督学习,强化学习,迁移学习

监督学习中的任务(问题):回归,分类,结构化

分类任务的模型:线性模型,深度学习,SVM,决策树

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值