卷积神经网络是如何反向调整参数的?
谷歌人工智能写作项目:神经网络伪原创
卷积神经网络反向传播和bp有什么区别
如何理解神经网络里面的反向传播算法
。
反向传播算法(BP算法)主要是用于最常见的一类神经网络,叫多层前向神经网络,本质可以看作是一个generalnonlinearestimator,即输入x_1...x_n输出y,视图找到一个关系y=f(x_1...x_n)(在这里f的实现方式就是神经网络)来近似已知数据。
为了得到f中的未知参数的最优估计值,一般会采用最小化误差的准则,而最通常的做法就是梯度下降,到此为止都没问题,把大家困住了很多年的就是多层神经网络无法得到显式表达的梯度下降算法!
BP算法实际上是一种近似的最优解决方案,背后的原理仍然是梯度下降,但为了解决上述困难,其方案是将多层转变为一层接一层的优化:只优化一层的参数是可以得到显式梯度下降表达式的;而顺序呢必须反过来才能保证可工作——由输出层开始优化前一层的参数,然后优化再前一层……跑一遍下来,那所有的参数都优化过一次了。
但是为什么说是近似最优呢,因为数学上除了很特殊的结构,step-by-step的优化结果并不等于整体优化的结果!不过,好歹现在能工作了,不是吗?
至于怎么再改进(已经很多改进成果了),或者采用其他算法(例如智能优化算法等所谓的全局优