李宏毅机器学习1-机器学习介绍

李宏毅机器学习1-机器学习介绍

image-20211116012000170

在整个机器学习的Framework里有

step1:找一个fuction set

step2:machine可以衡量一个function是好还是不好

step3:让machine有一个自动的方法,有一个好演算法可以挑出最好的function

image-20211116012324709

Regression(回归)

regression是machine learning的一个task,特点是通过regression找到的function,它的输出是一个scalar数值

Classification(分类)

Classification和regression的区别是:要求机器输出的东西的类别是不一样的。

在regression里机器输出的是scalar,而classification又分为两类:

Binary Classification(二元分类)

让机器输出yes or no。如判断邮件是否为垃圾邮件

Multi-class classification(多元分类)

让机器做选择题,每个选项是一个类别,从数个类别中选择正确的类别。如输入是一则新闻,输出是这个新闻属于哪一个类别

modle

Linear Model(线性模型)

Non-linear Model(非线性模型)

  • deep learning

  • SVM

  • decision tree

  • K-NN

Semi-supervised Learning(半监督学习)

在Semi-supervised Learning的技术里面,这些没有labeled的data,对机器学习也是有帮助的

lable(标签)

如果我们supervised Learning下进行学习,我们需要告诉机器function的input和output是什么。这个output往往没有办法用很自然的方式取得,需要人工的力量把它标注出来,这些function的output叫做label。

减少lable的用量就可使用半监督学习

image-20211116013301799

要想要一个分类器,输入图片,区别是猫还是狗。

有少量的猫和狗的labelled data,但是同时你又有大量的Unlabeled data,但是你没有力气去告诉机器说哪些是猫哪些是狗。

Semi-supervised Learning中这些没有labeled的data,对学习也有帮助。

Transfer Learning(迁移学习)

同样做猫狗分类

假设我们要做猫和狗的分类问题,一样只有少量的有label的data。但是我们现在有大量的data,这些大量的data中可能有label也可能没有label。

这些图片中可能有其他动物甚至动漫图片Transfer Learning考虑这些不相干的data可以对结果带来什么样的帮助。

Unsupervised Learning(无监督学习)

在完全没有任何label的情况下,机器到底能学到什么样的知识。

只有function的输入,没有任何的输出,机器该如何生成我们想要的图片

Structured Learning(结构化学习)

在structured Learning里,我们要机器输出的是,一个有结构性的东西

在分类的问题中,机器输出的只是一个选项;在structured类的问题里面,机器要输出的是一个复杂的物件

如:在语音辨识里面,机器输入是声音讯号,输出是一个句子。句子是要很多词汇拼凑完成。它是一个有结构性的object。在机器翻译里面你说一句话,你输入中文希望机器翻成英文,它的输出也是有结构性的。

Reinforcement Learning(强化学习)

image-20211116014928163

Supervised Learning:我们会告诉机器正确的答案是什么

比如训练一个聊天机器人,告诉他如果使用者说了“Hello”,你就说“Hi”;如果使用者说了“Bye bye”,你就说“Good bye”;就好像有一个家教在它的旁边手把手地教他每一件事情

Reinforcement Learning:我们没有告诉机器正确的答案是什么,机器最终得到的只有一个分数,就是它做的好还是不好,但他不知道自己到底哪里做的不好,他也没有正确的答案(从评价中学习);

比如训练一个聊天机器人,让它跟客人直接对话;如果客人勃然大怒把电话挂掉了,那机器就学到一件事情,刚才做错了,它不知道自己哪里做错了,必须自己回去反省检讨到底要如何改进,比如一开始不应该打招呼吗?还是中间不能骂脏话之类的

Alpha Go是用supervised Learning+reinforcement Learning的方式去学习的,机器先是从棋谱学习,有棋谱就可以做supervised的学习;之后再做reinforcement Learning,机器的对手是另外一台机器。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值