【台大李宏毅|ML】课程介绍

台大李宏毅老师机器学习公开课


本节知识点较少,自己记录留作自用,读者可以跳过。

官网给出的一张学习路线图,大概阐明了重要的知识点和学习过程,也罗列了课程布置的若干任务、
本节课梳理课程的大纲也是依赖于这张路线图来进行的。
在这里插入图片描述
图源网站李宏毅机器学习公开课

#1 机器学习↔机器自动寻找函数

  1. 智能系统↔函数

为了便于我们对机器学习快速建立一个了解,所谓机器学习的智能系统,可以看成是我们给定一种形式的输入,让机器反馈给我们相应的一个输出。
在这里插入图片描述

  1. 函数的类型

在我们学习如何让机器帮忙找到一个合适的函数之前,首先要先弄清楚,我们需要一个怎样的函数,即函数的类型。

①回归任务(regression)
当我们期望得到的结果是一个数值类型的时候,我们所进行的任务就叫做数值回归。

p.s. 这里是李老师主要是对概念进行一个简化描述,回归的严谨定义并不是这样。

②分类任务
当我们期望机器对于给定的类标进行一个选择的时候,我们就是在对数据或者事务进行一个分类。

根据类标的个数,分类任务可以分成是二分类(binary)或者是多分类(multiple-class)。

③产生任务
在这里插入图片描述

根据给定的一些数据集,我们希望产生一些更为复杂的输出,这个时候可以把这个机器学习任务统称为产生任务。

  1. 怎样告诉机器我们需要什么类型的函数呢?

①有监督学习(supervised learning)

所谓监督学习就是要同时告诉机器数据以及数据相应的标签,人工定义一个模型的损失函数作为评价标准,使用某种算法,让机器找出损失函数值(loss)最低的模型。
在这里插入图片描述

还有一个近几年来新兴的学习概念【强化学习】(reinforcement learning),现将其和监督学习进行一个比较:
在这里插入图片描述
【监督学习】:拿下围棋这件事为例,如果要用监督学习的模式来训练机器下围棋,则需要将棋盘上可能出现的每一种棋局情况以及相应的最优步骤都告诉机器,来进行训练。

【强化学习】:但是用强化学习的观念来训练机器下围棋的时候,就只需要给定初始的棋局,让机器自己和自己(或者和人)进行对决,利用得到的结果(reward)来矫正学习过程,进行闭环控制。

②无监督学习(unsupervised learning)

仅仅给机器一堆数据,但是不给定任何标记,使用相应的算法,也能让机器进行学习。


#2 前沿研究

  1. Explainable AI

以图像识别任务为例,机器不仅要告诉人类这张图片里有什么物体,还需要说明它判断此的理由是什么。

在这里插入图片描述
2. Adversarial Attack

为了应对有些不法分子专门针对机器特定的算法设计有些具有强误导性的噪声信号,从而使得算法崩溃的情况。

在这里插入图片描述
3. Network Compression

如何将数据集进行压缩,从而使得算法可运行。

  1. Anomaly Detection

异常检测是一个让机器知道“自己并不知道”这样的一个哲学问题。

拿图像识别系统为例,当一个识别动物的图像系统突然传入了动漫卡通人物,我们期望的结果并非系统根据像素点的特点强行把这张图片划分到某一个特定的动物类别;而是机器可以向人类反馈出它无法处理这类分类任务的信息。

在这里插入图片描述

  1. Transfer Learning

通常意义上我们对模型进行训练时,会将数据划分成训练集、测试集、验证集等,但是这些集合上的数据具有较为相同的形式和特点。

但是在实际应用中,我们用来训练的数据,和用来测试的客户数据往往会存在很多偏差,导致模型的正确率会骤降。

在这里插入图片描述

  1. Meta Learning

又涉及到一个哲学问题:
所谓机器学习是让机器具有学习的能力;
而meta learning就是让机器通过这个程序来学习如何学习。

在这里插入图片描述

meta learning提出来的意义就在于,我们希望通过机器自主学习来找到一个更为高效的算法。虽然,现在很多机器学习的算法和模型的落地产品看起来效果不错,那是得利于机器强大的计算能力,但其实机器使用的学习算法效率并不能算最优。
在这里插入图片描述


后记

本文系观看B站公开课视频所作,原视频链接见下:
https://www.bilibili.com/video/BV1JE411g7XF

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值