在上一篇文章中,我们已经讲了Softmax的数学原理,详细请见DJL-Java开发者动手学深度学习之使用Softmax进行分类
。在这里,我们就用Java代码来实现整个模型的训练。
准备数据集
int batchSize = 32;
boolean randomShuffle = true;
// 加载 训练集和验证集
FashionMnist trainingSet = FashionMnist.builder()
.optUsage(Dataset.Usage.TRAIN)
.setSampling(batchSize, randomShuffle)
.optLimit(Long.getLong("DATASET_LIMIT", Long.MAX_VALUE))
.build();
FashionMnist validationSet =