接上文,在了解数据集和一些基本方法后,我们正式开始利用pytorch对CNN网络进行实现(假定大家已经知道CNN有关知识了)
首先是对数据集的处理,这里进行一些补充,我们不仅可以从GitHub上下载mnist数据集,也可以在torchvision中datasets中下载
以上,我们下载好数据集后,还对数据集进行了处理,将数据分为一批一批的形式,每批次有64个数据,之后构建CNN网络
这里是一种“偷懒”的方式,我将每一次的卷积池化作为一个模块给到conv1和conv2并且对比二者,可以发现,其实Conv2d中的变量名是可以省略的,同理,全连接层的Linear也是一样,之后我们将正确率作为该网络的损失函数
接下来就是训练了,和前一个任务并无太多差别
可以从训练的输出中看出我们算法正在按照预期的运行
并且最终在测试集上取得了不错的结果
至此,CNN网络预测手写数字的任务就全部完成了。
总结与注意:
1、要明确每一次卷积池化后的数据大小
2、卷积池化完成后,在把数据放入全连接层之前要先reshape,将数据展开为向量
3、在构建网络时要记得继承nn.Module和调用构造函数