线性代数|机器学习-P27用于深度学习的神经网络结构

取个名字真难呐

已于 2024-07-27 18:07:25 修改

阅读量766

点赞数 28

文章标签：线性代数机器学习人工智能矩阵神经网络算法深度学习

于 2024-07-27 06:54:24 首次发布

本文链接：https://blog.csdn.net/scar2016/article/details/140729192

版权

1. 概述

– 1. 卷积神经网络 CNNs
– 2. 连续型线性分段函数 F
– 3. 损失函数
– 4. 链式法则计算反向传播算法梯度 $\nabla F= \mathrm{grad}\; F$

我们定义每个样本有m维度特征，有n个样本；具体如下
$\begin{equation} X=\begin{bmatrix}x_1&x_2&\cdots&x_n\end{bmatrix},x_i=\begin{bmatrix}x_{i1}\\\\x_{i2}\\\\\vdots\\\\x_{im}\end{bmatrix}\end{equation}$
最终问题为 二分类问题,创建一个神经网络函数 $F (x)$ 如下：
$\begin{equation} Result=\left\{ \begin{aligned} +1&&F(X)>0 \\ -1&&F(X)<0 \\ \end{aligned} \right. \end{equation}$
有趣的可视化训练神经网络网站 TensorFlow
激活函数，也叫非线性函数，是为了将线性函数转换为非线性函数，提高模型拟合能力
$\begin{equation} \mathrm{ReLu}(x)=\max\{0,x\} \end{equation}$
Epoch(一代训练) ：使用训练集的全部数据对模型进行一次完整训练为一代训练
Batch(一批数据)：使用训练集中的一小部分样本对模型权重进行一次反向传播的参数更新，这一部分样本被称为一批数据
Iteration(一次迭代)：使用一个Batch数据对模型继续宁一次参数更i性能的过程叫做一次迭代