本文重点
神经网络是一种模仿生物神经网络结构和功能的计算模型,它由大量的神经元(或称为节点)相互连接而成,每个神经元接收来自其他神经元的输入信号,并通过一定的权重和激活函数进行处理,产生输出信号。这种结构使得神经网络能够学习和识别复杂的模式和数据关系。本文详细解释神经网络模型如何完成数据训练任务。
简单来看
1.构建一个神经网络结构,然后随机初始化权值,通常很小,接近为0。
2.我们执行前向传播算法,也就是对该神经网络的任意一个输入x,计算出对应的hθ(x)的值
3.计算出代价函数J(θ)
4.执行反向传播算法来算出这些偏导数
5.利用数值检验方法检验这些偏导数(这里可以证明反向传播是否是正确的,如果是正确的那么执行第六步,进行优化代价函数时要梯度检验停止掉)
6. 使用梯度下降优化算法来最小化代价函数
神经网络中的代价函数J(θ)是一个非凸函数(非凸并不一