1. 线性神经网络

LION_SO

已于 2023-04-15 10:52:24 修改

阅读量150

点赞数

分类专栏：深度学习文章标签：深度学习神经网络机器学习人工智能 python

于 2023-04-15 10:52:10 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_45255276/article/details/130112419

版权

本文介绍了线性神经网络的基础知识，包括线性回归的模型、损失函数、解析解和小批量梯度下降。接着，讨论了如何在Python中实现线性回归，以及如何使用softmax进行多分类。最后，讲解了图像分类数据集的处理，并提供了从零开始实现和简洁实现的代码示例。

摘要由CSDN通过智能技术生成

1. 线性回归

1.1 基本元素

1.1.1 模型

$\hat{y}=\boldsymbol{w}^\top\boldsymbol{x}+b$

1.1.2 损失函数

$L\left(\boldsymbol{W}, b\right)=\frac{1}{n}\sum\limits_{i=1}^nl^{(i)}\left(\boldsymbol{w}, b\right)$
其中
$l^{(i)}\left(\boldsymbol{w},b\right)=\frac{1}{2}\left(\hat{y}^{(i)}-y^{(i)}\right)^2$

1.1.3 解析解

线性回归模型是存在解析解的，即，用一个公式直接将解表达出来，但并不是所有模型都有解析解
$\boldsymbol{w}^*=\left(\boldsymbol{X}^\top\boldsymbol{X}\right)^{-1}\boldsymbol{X}^\top\boldsymbol{y}$

1.1.4 小批量梯度下降

这是一种用于在无法求得解析解的情况下，有效训练模型的方法

初始化模型参数的值，如随机初始化
从数据集中随机抽取小批量样本 $\mathcal{B}$
- 在负梯度的⽅向上更新参数，具体更新如下
- 其中 $\eta$ 是一个预先确定的正数
  $\left(\boldsymbol{w}, b\right)\leftarrow\left(\boldsymbol{w}, b\right)-\frac{\eta}{\left|\mathcal{B}\right|}\sum\limits_{i\in\mathcal{B}}\partial_{\left(\boldsymbol{w}, b\right)}l^{(i)}\left(\boldsymbol{w}, b\right)$
不断重复第 2 步

1.2 矢量化加速

在 Python 中不要自己写 for 循环，要写矢量化的代码，这通常会带来数量级的加速

1.3 正态分布与平方损失

正态分布

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
1. 线性神经网络

根据李沐老师的动手学深度学习 Pytorch 版本整理得来，本文主要介绍了线性回归和 softmax 回归。它们虽然是传统的 ML 算法，但也可以看作没有隐藏层的神经网络，是后续学习深度学习的基础。同时，也给出了机器学习的一般过程，即，加载数据，定义模型、损失、优化器，训练和预测。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。