卷积层 和 只用完全连接的神经层比起来有两个优势
1.parameters sharing
2.sparsity of connections
一个例子
x是一个图像,y可以是一个二进制标签或者其中之一的诱因
插入图像,有卷积层,池化层,全连接层,一个softmax控制的输出y^.
卷积神经网络层和完全连接层有各种参数,权重W,偏差b。
参数的设置让我们定义一个成本函数;随机初始化W,b,计算J,作为整个训练集的神经预测损失的总和。
为了训练这个神经网络,需要做一些使用梯度下降类似的的算法
为了优化所有神经网络参数来试图降低成本函数J