第一:epoch
神经网络训练时候 y=wx +b , 要把所有数据集样本通过网络计算出y'结果,然后计算平均损失:
Loss=( ∑(y - y')^2 ) / n(样本总个数)
然后一次接一次地通过梯度下降法,得出比较小的Loss,此时才算训练完成。
上面说的一次接一次 就是epoch的次数。
第二:batch_size
上面每次训练的过程中,因为需要把所有样本送到神经网络计算一遍,用cpu的话比较慢,因为
要一个一个先后按顺序,所以我们使用gpu,在当次epoch过程中可以同时进行运算,同时运算多少个
样本(用同样的w和b运算),这个就是batch_size。