ML 2022 Spring (ntu.edu.tw)https://speech.ee.ntu.edu.tw/~hylee/ml/2022-spring.php
一. 概念
机器学习可以应用到很多场景中,例如语音识别、图像识别、AI智能下棋等。
它的输入可以是一段声音信号/图片/物体之间的位置关系,数据类型例如:Vector、Matrix、Sequence等。之后通过机器学习寻找一种将输入进行转化为你想要的输出结果的方法,经过这个方法的计算之后得到最终的输出信息,例如:这段声音信号所说的内容、图片中属于什么动物、棋子下一步最佳应该落到什么位置等。
这个寻找Function并进行计算的过程就是机器学习需要完成的工作。
二. 机器学习的种类
根据不同的任务从而选择不同函数方法的不同,机器学习最常用的是regression(回归)和classification(分类)。
1.regression(回归)
模型的输出为数值,一般应用于预测房价、温度、空气指数等。例如:输入和目标任务PM2.5相关的feature,经过该模型所设计的方法流程计算后,就能得到预测的明天的PM2.5数值并且输出。寻找这一组方法的过程就是Regression需要完成的任务。
2.classification(分类)
多适用于做选择时,事先给定期望输出的一些类别结果,模型根据输入可以输出对应的类别。例如:分类模型能甄别邮件是否为垃圾邮件;下棋中使用分类模型预测下一步落在哪个棋盘格上赢面最大。
3.Structured Learning(结构化学习)
机器在学习的时候不只输出一个数字,不单单做选择题,还要生成有结构的物件。也就是让机器学会创造。
三、六次作业的类型
四、教机器学习的几种方法
1.监督学习
训练数据是有标签的
2.自监督学习
用通用的数据进行预训练(Pre-trained Model,又称Foundation Model)。这些数据可以进行翻转或变色产生更多数据。用训练好的数据再去识别原来的任务(下游任务,Downstream Tasks)
最有名的模型:BERT,有340Million的参数
3.生成对抗网络(GAN)
数据和标签不需要匹配了
4.强化学习(RL)
不知道如何标注资料,但可以定义什么是成功时。
5.异常检测(AD)
除了给出答案,还可以给出选项:这个啥也不是。
6.可解释性AI
7.模型攻击
图片上加了一个小杂质后,机器的结果发生了变化。
8. 领域自适应
往往假设训练数据和测试数据的分布是类似的,当它们不同时应如何处理?
9.Network Compression
压缩模型使其在不同终端上运行
10.终生学习
机器不断掌握一个个技术,天网为何还没出现?为什么无法让机器不断学习新的技术?
11. 元学习
学习如何学习。让其从大量任务中自己发明新的算法进行学习。
Few-shot learning:用少量的资料进行标注学习。
有时将二者等同,现在要做到Few-shot learning,会需要用到Meta Learning的技术,即需要让机器自己发明新的算法,才能有办法用少量的资料去学习。
碎碎念:开课啦!趁碎片时间慢慢学习深度学习中,不定期更新,一起加油呀!