目录
Introduction
本文PDF课件:下载地址
机器学习本质是自动寻找函数式
例如:
- speech recognition
f ( 输入音频信号 )= “how are you” - image recognition
f ( 输入图像 )= “Cat”
你想找到怎么样的函数式
-
regression(回归):
输出是一个数值 -
classfication(binary,multi-class):
输出是一个类型 -
generation:
输出复杂结果(图片、语句)
怎么告诉机器你想找什么样的函数式?
- 函数的Loss:
labeled data >>> function >>> 结果
Loss = 结果的错误率
机器会自动寻找Loss最低的函数式
supervised learning
有监督学习,给机器输入训练数据(Labeled Data),告诉机器:某一具体情况,输出对应的结果
unsupervised learning
无监督学习,输入的数据为Unlabeled Data
-
transfer learning:
迁移学习,训练数据跟测试数据的类型不一样的,例如以黑白图片训练识别数字,测试时使用了彩色图片,如何使机器也能输出正确的结果 -
meta learning:
教机器学习如何去学习 -
life-long learning(continous learning):
终身学习,不停学习
reinforcement learning
强化学习,属于无监督学习
输入First step >>> 经过many steps自由发展 >>> 输出了正确结果
则把输出了正确结果的步骤作为Reward,并以此引导机器学习的方向
谷歌的产品:
Alpha GO = supervised learning + reinforcement learning
Alpha ZERO = reinforcement learning
三者区别
(1)监督学习有反馈,无监督学习无反馈,强化学习是执行多步之后才反馈。
(2)强化学习的目标与监督学习的目标不一样,即强化学习看重的是行为序列下的长期收益,而监督学习往往关注的是和标签或已知输出的误差。
(3)强化学习的奖惩概念是没有正确或错误之分的,而监督学习标签就是正确的,并且强化学习是一个学习+决策的过程,有和环境交互的能力(交互的结果以惩罚的形式返回),而监督学习不具备。
explainable AI:
可解释性AI,让机器告诉人们它是怎么做的
机器怎么找出你想要的函数式
给定函数式的寻找范围
给定函数式的寻找方法
Gradient Descent (梯度下降)