加入有四个数据分成两个批次则每个批次有两个样本,在一次迭代中每次送入一个批次的数据。
批次一:
样本 1: [0.1, 0.2]
样本 2: [0.3, 0.4]
样本 1的前向传播计算:
输入数据:[0.1, 0.2]
输入层到隐藏层的计算:
隐藏层输入 = 输入数据 x W1 + b1 (其中 b1 是偏置,此处不包括偏置的计算)
隐藏层输入 = [0.1, 0.2] x [[0.1, 0.2], [0.3, 0.4]] = [0.07, 0.1]
隐藏层的输出 = 激活函数(隐藏层输入) = 激活函数([0.07, 0.1])
隐藏层到输出层的计算:
输出层输入 = 隐藏层的输出 x W2 + b2 (假设 b2 也是零,此处不包括偏置的计算)
输出层输入 = 激活函数([0.07, 0.1]) x [[0.5], [0.6]] = [0.12]
输出层的输出 = 激活函数(输出层输入) = 激活函数([0.12])
样本 2的前向传播计算:
输入数据:[0.3, 0.4]
输入层到隐藏层的计算:
隐藏层输入 = 输入数据 x W1 + b1
隐藏层输入 = [0.3, 0.4] x [[0.1, 0.2], [0.3, 0.4]] = [0.15, 0.22]
隐藏层的输出 = 激活函数(隐藏层输入) = 激活函数([0.15, 0.22])
隐藏层到输出层的计算:
输出层输入 = 隐藏层的输出 x W2 + b2
输出层输入 = 激活函数([0.15, 0.22]) x [[0.5], [0.6]] = [0.1572]
输出层的输出 = 激活函数(输出层输入) = 激活函数([0.1572])入)
其实每层可以合成一步矩阵运算