把自己在学习深度学习过程中搜索的各种问题记到这里。
X = torch.normal(0, 1, size=(2, 1))
意思是从均值为0,标准差为1的正态分布中抽取随机数,2行1列,“size=”可以省略不写param -= lr * param.grad / batch_size
这就是梯度下降。(-=已存入内存)
- 全连接层:是每一个结点都与上一层的所有结点相连,用来把前边提取到的特征综合起来
- Fashion-MNIST下载后,mnist_train有6000行,2列。其中
mnist_train[i][0].shape=[1][28][28]
,因为每个输入图像的高度和宽度均为28像素, 数据集由灰度图像组成,其通道数为1。mnist_train[i][1]
取值为0-9,表示它的10个类别,分别为t-shirt(T恤)、trouser(裤子)、pullover(套衫)、dress(连衣裙)、coat(外套)、sandal(凉鞋)、shirt(衬衫)、sneaker(运动鞋)、bag(包)和ankle boot(短靴)。 -torch.log(y_hat[range(len(y_hat)),y])
的解释&#