ANN---人工神经网络的学习_ann用于回归-CSDN博客

本文链接：https://blog.csdn.net/BGMcat/article/details/121069218

简述：⼈⼯神经⽹络（artificial neural network，ANN），简称神经⽹络（neural network，NN）。是⼀种模仿⽣物神经⽹络(动物的中枢神经系统，特别是⼤脑)的结构和功能的数学模型或计算模型，⽤于对函数进⾏估计或近似。

激活函数

非线性变换，将累加信号变换后输出，一般使用压缩函数。来限制振幅。作用：增强网络表达能力，非线性输出，没有激活函数就相当于矩阵相乘。一个神经网络中不一定只有一种激活函数，一般选择非线性激活函数，输出层激活函数取决于任务类型。

常见的隐含层激活函数：

后两个为现在常用的激活函数。
在这里插入图片描述

输出层激活函数：

恒等激活函数（回归问题）
Softmax激活函数（分类问题）
在这里插入图片描述
交叉熵损失就是多类别下的负平均对数似然函数。

万能近似定理

根据万能近似定理，对于具有线性输出层和至少一个使用“挤压”性质的激活函数的隐藏层组成的前馈神经网络，只要其隐藏层神经元的数量足够，它可以以任意的精度来近似任何从一个定义在实数空间中的有界闭集函数。即一个三层神经网络可以拟合任何决策函数。

梯度下降法（便于寻参）

确定了代价函数后，随机选取w 和b的初始值，应用迭代算法，来求取目标函数的局部极值
在这里插入图片描述

自动微分法（便于求导）

梯度计算可以通过⼿动求导（Manual Differentiation）得到每个参数的偏导数是难以完成的，数值微分（NumericalDifferentiation）结果为近似值且计算量较大，符号微分（Symbolic Differentiation）在复杂函数中性能表现也不
够好。
⾃动微分法（Autodiff），包括前向⾃动微分法 (Forward-ModeAutodiff)和反向⾃动微分法(Reverse-mode Autodiff)，是⼀种⾼效求解复杂函数梯度的⽅法。现代神经⽹络求解模型参数⼀般使⽤反向⾃动微分法，它包含两个过程，⾸先从输⼊到输出计算节点的值，然后从输出到输⼊计算偏导数，利⽤导数的链式法则来得到最终的结果。
在这里插入图片描述
沿线相乘，分线相加