机器学习相关介绍
来源:台大 李宏毅 2020机器学习深度学习
目录
一、前言
2021.1.9 从今天起开始系统地学习深度学习。
二、课程目录
课程网页:
李宏毅教授的机器学习课程网页
三、机器学习是让机器自动找函数
四、你想要找什么样的函数?
- 如果要找的函数的输出是一个数值(scalar):Regression
- 如果要找的函数的输出是两个或多个可能:Classification
- 二分类(Binary Classification)
- 多分类(Multi-class Classification)
机器学习除了Regression、Classification外,还有Generation(生成)。 Generation就是产生有结构的复杂东西,如文句、图片等
五、怎样告诉机器你想找什么样的函数?(将想法传达给机器)
- Supervised Learning 监督学习
给数据打标签
标签就是针对某个输入的理想的、正确的输出
函数的Loss
损失函数Loss: 评估一个函数的好坏的函数
Loss越小越好
期待机器会自动找出Loss最小的函数
监督学习 V.S. 强化学习
监督学习需要输入和对应的输出作为训练数据,强化学习不需要输出数据,通过Reward(奖惩)矫正学习过程使其不断改进和学习
Alpho Go is supervised learning + reinforcement learning.
Alpho Zero is totally reinforcement learning.
- Unsupervised Learning 无监督学习
没有标签
六、机器怎样找出你想要的函数?
1. 给定函数的寻找范围:Linear function、Neural network…
2. 函数寻找方法 —— Gradient Descent
机器学习的学习算法:梯度下降
可以自己实现算法,或者使用深度学习框架(PyTorch、TensorFlow…)
七、前沿研究
- Explainable AI 可解释的AI
输入一张猫的图片,机器为什么判断这是一只猫?
- Adversarial Attack 对抗攻击
加入一些对机器影响较大的噪声,机器学习的效果会不会下降? (鲁棒性)
- Network Compression 网络压缩
现在的影像辨识可以得到非常高的正确率,但这依赖于非常巨大的模型,如何将这个模型缩小使其可以放到手机等终端设备上,这就是网络压缩Network Compression
- Anomaly Detection 异常检测
对于训练时没有遇到过的东西,机器要能够知道“我不知道”,而不是强行对其判断分类
不是
而是
- Transfer Learning 迁移学习 (Domain Adversarial Learning)
对于测试数据,它往往和训练数据相似,这会得到很高的正确率
但实际应用中,测试数据往往不同于训练数据的类型
- Meta Learning == Learn to learn
赋予机器学习如何学习的能力,机器自己发明自己的学习算法