李宏毅老师机器学习2020学习笔记与思考(一)Introduction

机器学习是什么->自动寻找函数

首先要知道寻找什么函数(输入与输出)

例:

  • Regression(回归)-output of the function is a scalar
  • Binary Classification(二分类)-output Yes or No
  • Multi-class Classification(多类别分类)-output Class1, Class 2, Class3…
  • Generation(生成)-生成很多复杂的东西,如图片、文字等

监督学习、半监督学习、无监督学习与强化学习

  • Supervised Learning 监督学习
    监督学习需要训练集训练,训练前需要labeling处理,训练的过程期待机器通过各种方式,找到loss最小的的函数。以围棋为例,监督学习需要教给机器每一步怎么走,然后机器通过既定的学习进行test data的处理。
  • Semi-supervised Learning 半监督学习
    部分数据有标签部分数据没有标签,相较于监督学习成本低,但是准确度比较高。
  • Unsupervised Learning 无监督学习
    无标签,通过数据之间的内在联系和相似性将他们分成若干类——聚类。根据数据本身的特性,从数据中根据某种度量学习出一些特性。
  • Reinforcement Learning 强化学习
    强化学习类似于半监督学习,通过很多步最终得到一个reward,在reward的反馈下,机器可以知道学习过程中的问题。以围棋为例,强化学习过程中机器first move->second move->…->last move—>win!(reward)通过最后win这个结果,来反思自己每一步的问题并进行学习。

怎么找函数

先给定一个函数范围,通常为线性(linear)或network architechture(RNN CNN等),然后在这个范围内,寻找函数,寻找的过程最常见的是Gradient Descent(梯度下降法)。

课程网站

课程作业网站
附二维码:
课程作业网站

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值