数据集D={(x1,y1); (x2,y2);…; (xm,ym)}, 其中一个示例x由d个属性描述,
x=(x1; x2; …; xd),线性模型试图学得一个通过属性的线性组合来进行预测的函数,即
f(x) = w1*x1 + w2*x2 + …+ wd*xd + b, 其中w=(w1;w2;…;wd)和b学得后,模型就能确定。
确定w和b的关键在于如何衡量f(x)与y之间的差别,均方误差是回归任务中最常用的性能度量。均方误差对应了几何学中的欧氏距离,基于均方误差最小化来进行模型求解的方法称为“最小二乘法”,目的是找到一条直线,使得所有样本到直线的欧氏距离之和最小。
代价函数:
用梯度下降法更新参数:
import torch
from torch.autograd import Variable
#训练集
x_data = Variable(torch.FloatTensor([[1.0],[2.0],[3.0]]))
y_data = Variable(torch.FloatTensor([[3.0],[6.0],[9.0]]))
#以torch的神经网络为父类
class Model(torch.nn.Module):
def __init__(self):
super(Model,self).__init__()
self.linear = torch.nn.Linear(1,1) #一个输入,一个输出,线性模型
def forward(self, x):
y_pred = self.linear(x)
return y_pred
model =Model()
#损失函数
criterion = torch.nn.MSELoss(size_average=False)
#随机梯度下降法,优化算法策略 W := W-lr*dy/dW
optimizer = torch.optim.SGD(model.parameters(),lr=0.057)
for epoch in range(50):
y_pred = model(x_data)
loss = criterion(y_pred, y_data)
print(epoch,loss.data[0])
optimizer.zero_grad()#意思是把梯度置零,也就是把loss关于weight的导数变成0.
loss.backward()
optimizer.step()#更新所有参数
h = Variable(torch.FloatTensor([[4.0]]))
print(model.forward(h).data[0][0])