1、pytorch中的.item()用于将一个零维张量转换成浮点数.
2、torch.utils.data.DataLoader
PyTorch中数据读取的一个重要接口是torch.utils.data.DataLoader,该接口定义在dataloader.py脚本中,只要是用PyTorch来训练模型基本都会用到该接口,该接口主要用来将自定义的数据读取接口的输出或者PyTorch已有的数据读取接口的输入按照batch size封装成Tensor,后续只需要再包装成Variable即可作为模型的输入,因此该接口有点承上启下的作用,比较重要。
关于源码的解析可以看这篇:
https://blog.csdn.net/u014380165/article/details/79058479
3、 for i, (images, labels) in enumerate(train_loader):
enumerate() 函数用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列,同时列出数据和数据下标,一般用在 for 循环当中。
4、
#Reshape images to (batch_size, input_size)
images = images.reshape(-1, 28*28)
reshape中-1的理解:数组新的shape属性应该要与原来的配套,如果等于-1的话,那么会根据剩下的维度计算出数组的另外一个shape属性值。
例如:
z = np.array([[1, 2, 3, 4],
[5, 6, 7, 8],
[9, 10, 11, 12],
[13, 14, 15, 16]])
z.shape
(4, 4)
z.reshape(-1,1)就变成了16行1列。
z.reshape(-1,1)
array([[ 1],
[ 2],
[ 3],
[ 4],
[ 5],
[ 6],
[ 7],
[ 8],
[ 9],
[10],
[11],
[12],
[13],
[14],
[15],
[16]])
5、 _, predicted = torch.max(outputs.data, 1)
torch.max()的第一个输入是tensor格式,所以用outputs.data而不是outputs作为输入;第二个参数1是代表dim的意思,也就是取每一行的最大值,其实就是我们常见的取概率最大的那个index;第三个参数loss也是torch.autograd.Variable格式。
6、 correct += (predicted == labels).sum()
#两个一维张量逐行对比,相同的行记为1,不同的行记为0,再利用sum(),求总和,得到相同的个数。
7、super(Net,self). --init__()
super()函数是一个继承父类调用的一个函数,就是包含了父类函数的所有性质
8、x.view(-1,self.num_flat_features(x)),这里-1就是把后面的矩阵展成一维数组,以便后面线性变换层操作
9、