2021李宏毅机器学习（1）：基本概念

三耳01

已于 2022-02-11 19:31:03 修改

阅读量755

点赞数

分类专栏：机器学习、深度学习文章标签： pytorch 机器学习深度学习神经网络人工智能

于 2022-02-11 19:29:08 首次发布

本文链接：https://blog.csdn.net/niexinyu0026/article/details/122878520

版权

机器学习、深度学习专栏收录该内容

25 篇文章 39 订阅

订阅专栏

2021李宏毅机器学习（1）：基本概念

1 基本概念

B站上2021李宏毅机器学习课程的学习笔记，供复习用。

1 基本概念

机器学习归根结底就是寻找一个函数。

1.1 不同的函数类别

回归Regression——输出是数值
分类Classification——输出是不同的类别classes，做选择题
结构学习Structured Learning——产生一个有结构的文件（画一张图、写一篇文章），就是让机器学会创造

1.2 如何寻找函数（Training）：

首先，写出一个带有未知参数的函数；
其次，定义loss（一个与参数有关的函数，MAE——绝对误差，MSE——均方误差）；
最后，优化，找到使loss最小的参数——梯度下降
１）随机选择参数初始值；
２）计算 $\left.\frac{\partial L}{\partial w}\right|_{w=w^{0}}$ ，然后沿着梯度下降的地方步进，步进的大小是　 $\left.lr\times\frac{\partial L}{\partial w}\right|_{w=w^{0}}$
３）更新参数
这个方法有一个巨大的缺陷：通常会求出Local minima，但我们想要的是global minima

1.3 模型

线性模型linear model有很大的限制，无法模拟折线、曲线的情况，这种限制叫做model bias，所以需要改进。
改进方法：Piecewise Linear Curves
在这里插入图片描述
很多这样的集合可以拟合成曲线。

1.3.1 sigmoid

可以用sigmoid函数 $\frac{1}{1+e^{-\left(b+w x_{1}\right)}}＝ｃ sigmoid(b+wx_1)$ 拟合蓝色的折线：
$y=b+\sum_{i} c_{i} \operatorname{sigmoid}\left(b_{i}+\sum_{j} w_{i j} x_{j}\right)$
在这里插入图片描述
这里面的所有未知参数，都用 $\theta$ 表示：

一次性用所有 $\theta$ 来计算，进行梯度下降，这样的数据量太大，所以采用小批量batch：

每一个data里面更新的次数取决于数据总量和batch数量：

1.3.2 ReLU

前面用的是soft sigmoid，也就是曲线，其实可以用两个ReLU拟合成hard sigmoid，也就是折线：
在这里插入图片描述
上面的sigmoid公式就变成了：

1.3.3 对sigmoid的计算可以多做几次

在这里插入图片描述
这样的层数多了，就叫做神经网络Neural Network，后来叫做Deep learning=Many hidden layers

三耳01

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
2021李宏毅机器学习（1）：基本概念

2021李宏毅机器学习（一）——基本概念B站上2021李宏毅机器学习课程的学习笔记，供复习用。1、机器学习就是寻找一个函数2、不同的函数类别：回归Regression——输出是数值分类Classification——输出是不同的类别classes，做选择题结构学习Structured Learning——产生一个有结构的文件（画一张图、写一篇文章），就是让机器学会创造3、如何寻找函数（Training）：首先，写出一个带有未知参数的函数；其次，定义loss（一个与参数有关的函数，MAE—
复制链接

扫一扫