机器学习(李宏毅2020)-课程笔记

Introduction

本文PDF课件:下载地址

机器学习本质是自动寻找函数式

例如:

  • speech recognition
    f ( 输入音频信号 )= “how are you”
  • image recognition
    f ( 输入图像 )= “Cat”

你想找到怎么样的函数式

  • regression(回归)
    输出是一个数值

  • classfication(binary,multi-class)
    输出是一个类型

  • generation
    输出复杂结果(图片、语句)

怎么告诉机器你想找什么样的函数式?

  • 函数的Loss
labeled data >>>  function >>> 结果

Loss = 结果的错误率
机器会自动寻找Loss最低的函数式

supervised learning

有监督学习,给机器输入训练数据(Labeled Data),告诉机器:某一具体情况,输出对应的结果

unsupervised learning

无监督学习,输入的数据为Unlabeled Data

  • transfer learning:
    迁移学习,训练数据跟测试数据的类型不一样的,例如以黑白图片训练识别数字,测试时使用了彩色图片,如何使机器也能输出正确的结果

  • meta learning:
    教机器学习如何去学习

  • life-long learning(continous learning):
    终身学习,不停学习

reinforcement learning

强化学习,属于无监督学习

输入First step >>> 经过many steps自由发展  >>> 输出了正确结果

则把输出了正确结果的步骤作为Reward,并以此引导机器学习的方向

谷歌的产品:
Alpha GO = supervised learning + reinforcement learning

Alpha ZERO = reinforcement learning

三者区别

(1)监督学习有反馈,无监督学习无反馈,强化学习是执行多步之后才反馈。
(2)强化学习的目标与监督学习的目标不一样,即强化学习看重的是行为序列下的长期收益,而监督学习往往关注的是和标签或已知输出的误差。
(3)强化学习的奖惩概念是没有正确或错误之分的,而监督学习标签就是正确的,并且强化学习是一个学习+决策的过程,有和环境交互的能力(交互的结果以惩罚的形式返回),而监督学习不具备。

explainable AI
可解释性AI,让机器告诉人们它是怎么做的

机器怎么找出你想要的函数式

给定函数式的寻找范围
给定函数式的寻找方法
Gradient Descent (梯度下降)

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值