机器学习（李宏毅2020）-课程笔记

最新推荐文章于 2022-10-07 22:02:47 发布

风中—匹狼

最新推荐文章于 2022-10-07 22:02:47 发布

阅读量1.3k

点赞数

分类专栏：李宏毅机器学习

本文链接：https://blog.csdn.net/qq_40881341/article/details/104699174

版权

李宏毅机器学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

Introduction

本文PDF课件：下载地址

机器学习本质是自动寻找函数式

例如：

speech recognition
f （输入音频信号）= “how are you”
image recognition
f （输入图像）= “Cat”

你想找到怎么样的函数式

regression（回归）：
输出是一个数值
classfication（binary，multi-class）：
输出是一个类型
generation：
输出复杂结果（图片、语句）

怎么告诉机器你想找什么样的函数式？

函数的Loss：

labeled data >>>  function >>> 结果

Loss = 结果的错误率
机器会自动寻找Loss最低的函数式

supervised learning

有监督学习，给机器输入训练数据（Labeled Data），告诉机器：某一具体情况，输出对应的结果

unsupervised learning

无监督学习，输入的数据为Unlabeled Data

transfer learning:
迁移学习，训练数据跟测试数据的类型不一样的，例如以黑白图片训练识别数字，测试时使用了彩色图片，如何使机器也能输出正确的结果
meta learning：
教机器学习如何去学习
life-long learning（continous learning）：
终身学习，不停学习

reinforcement learning

强化学习，属于无监督学习

输入First step >>> 经过many steps自由发展  >>> 输出了正确结果

则把输出了正确结果的步骤作为Reward，并以此引导机器学习的方向

谷歌的产品：
Alpha GO = supervised learning + reinforcement learning
Alpha ZERO = reinforcement learning

三者区别

（1）监督学习有反馈，无监督学习无反馈，强化学习是执行多步之后才反馈。
（2）强化学习的目标与监督学习的目标不一样，即强化学习看重的是行为序列下的长期收益，而监督学习往往关注的是和标签或已知输出的误差。
（3）强化学习的奖惩概念是没有正确或错误之分的，而监督学习标签就是正确的，并且强化学习是一个学习+决策的过程，有和环境交互的能力（交互的结果以惩罚的形式返回），而监督学习不具备。

explainable AI：
可解释性AI，让机器告诉人们它是怎么做的

机器怎么找出你想要的函数式

给定函数式的寻找范围
给定函数式的寻找方法
Gradient Descent （梯度下降）

风中—匹狼

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
机器学习（李宏毅2020）-课程笔记

目录Introduction机器学习本质是自动寻找函数式你想找到怎么样的函数式怎么告诉机器你想找什么样的函数式？supervised learningunsupervised learningreinforcement learning机器怎么找出你想要的函数式Introduction机器学习本质是自动寻找函数式例如：speech recognitionf （输入音频信号）= “ho...
复制链接

扫一扫