【李宏毅机器学习学习1】

最新推荐文章于 2023-11-09 11:40:06 发布

Raphael9900

最新推荐文章于 2023-11-09 11:40:06 发布

阅读量844

点赞数 2

本文链接：https://blog.csdn.net/Raphael9900/article/details/127977851

版权

一、概述

机器学习其实相当于让机器找一个函数。机器学习可以应用：语音识别、图像处理、playGO...

深度学习是机器学习中的一个关键技术。深度学习是要找一个函数（类神经网络Neutral Network）。深度学习函数的输入可以是向量（vector）、矩阵（matrix）（一张图片就可以用一个矩阵表示）、序列（sequence）（一段声音信号、一段文字就是一段序列）。输出可以是数值（scalar）（输出是一个数值的任务叫做回归regression）、类别（这样的任务叫做分类classification）、一段话或者是图片。

supervisd learning需要每个任务都要收集大量的数据，于是在Self-supervised Learning里面，我们期待模型做到的事情是：在训练模型之前，先做到基本功（Pre-train）。在做好pre-train之后，就可以在新的任务上做的很好。让机器透过没有标注的图片（unlabeled images），学习一些基本的任务（比如说辨别两张相互翻转的图片是同一张，两张颜色不一样形状一样的图片是同一张）。进行图片分类的机器学习任务叫下游任务（Downstream Tasks）。当机器学会基本的任务之后（分类图片等），就会对下游任务有很好的结果。

Pre-trained Model对于downstream tasks来说，就相当于os对于app的作用。在一个工程师为了开发新的app的时候，不需要处理底层任务。拥有好的pre-tained model就会在downstream tasks中有好的结果。downstream tasks还可以称为fundation model。在fundation model里面，最知名的一个是模型叫BERT（340M parameters，一个很大的模型，现在已经出现了很多比bert还大的模型了）。

Generative Adversarial Network可以实现，对于输入x输出y的函数，x和y是很庞大的一个数据集，而不需要x和y之间有成对的关系（unpaired），机器就可以自动找出他们的关系。代表的论文：（unsupervised ASR）

https://arxiv.org/abs/1804.00316
https://arxiv.org/abs/1812.09323
https://arxiv.org/abs/1904.04100
https://arxiv.org/abs/2105.11084