- 样本和特征的概念
- i:样本编号;n:特征编号
- 运用mini-batch,变成矩阵运算,利用GPU的并行计算性能提高计算速度
- nn.Linear(8, 1)表示输入8维,输出1维 nn.Linear用法解释
- 如何用Linear构造一个多线性层的神经网络? (8, 6)=> (6, 4) => (4, 1),即分步地降低维度
- 有时候先升维,再降维,是为了引入更多的神经元(参数),能拟合的数据量更大,但也更容易过拟合(记住了样本中的噪声)
- 本算法中torch.nn.Sigmoid() 是将其看作是网络的一层,而不是简单的函数使用,因此不是F.sigmoid
- torch.sigmoid、torch.nn.Sigmoid和torch.nn.functional.sigmoid的区别
课上代码:
import numpy as np
import torch
import torch.nn as nn
import torch.optim as optim
xy = np.loadtxt("diabetes.csv.gz", delimiter=",", dtype=np.float32)
x_data = torch.from_numpy(xy[:, :-1])
y_data = torch.from_numpy(xy[:, [-1]]) #[-1] 最后得到的是个矩阵,为了保持x,y均为矩阵形式
class Model(nn.Module):
def __init__(self):
super(Model, self).__init__()
self.linear1 = nn.Linear(8, 6)
self.linear2 = nn.Linear(6, 4)
self.linear3 = nn.Linear(4, 1)
self.sigmoid = nn.Sigmoid() # 这里的torch.Sigmoid()是网络的一层,而不仅仅是一个函数
def forward(self, x):
x = self.sigmoid(self.linear1(x))
x = self.sigmoid(self.linear2(x))
x = self.sigmoid(self.linear3(x))
return x
model = Model()
criterion = nn.BCELoss(reduction='mean')
optimizer = optim.SGD(model.parameters(), lr=0.1)
for epoch in range(1000):
y_pred = model(x_data)
loss = criterion(y_pred, y_data)
print(epoch, loss.item())
optimizer.zero_grad()
loss.backward()
optimizer.step()
print(model.linear1.weight.data) # 查看某层的权重
print(model.linear1.bias.data) #查看某层的偏置