记录一下要点
1.训练集上的准确率是在一个epoch的过程中计算得到的,测试集上的准确率是在一个epoch结束后计算得到的,后者的模型参数更优
2.
pytorch的计算精度没有numpy的高,所以exp(100)是inf无穷大,一开始还以为要讲数据先处理一下,归一化还是sigmoid??? 这错误犯得也太弱智了。。怎么可以这么做 softmax学了这么多了,其实softmax也相当于一个激活函数吧。好像考试的时候考过
3.多层感知机,,也就那样 之前一直用的tensorflow,顺带学习一下pytorch
num_inputs, num_outputs, num_hiddens = 784, 10, 256
net = nn.Sequential(
d2l.FlattenLayer(),
nn.Linear(num_inputs, num_hiddens),
nn.ReLU(),
nn.Linear(num_hiddens, num_outputs),
)
看来都差不多,和Keras