例如EPOCH_NUM=18,PREDICT_NUM=20,batch_size=1024,every_n_step=10万,
训练样本条数=1.49亿。
EPOCH_NUM是指训练数据循环18轮,PREDICT_NUM是指预测前20个保存的模型。
训练样本条数*EPOCH_NUM/(batch_size*every_n_step)=checkpoint保存模型的个数。
例如,上面的数据,every_n_step是每运行多少步保存一个checkpoint,模型走一步是走了一个batch_size,即1024个数据走了1步。batch_size*every_n_step就是指的保存一个checkpoint会扫过多少数据。