我有一个CNN,我用它来检测面部关键点。我可以画出地面的真实点和预测的关键点显示。然而,它们聚集在图像的中心,在训练期间或训练后不会移动。在
我用的是nll\u loss和SGD优化器。通过这个,我得到了预期的损失值,比如0.00364755。我读到MSE是回归问题的一个很好的选择,我把损失函数改为MSE,现在我得到的所有训练都是nan作为我的损失。我已经系统地改变了参数,例如lr从0.1-0.0000001,动量0.1-0.9,批量大小为1,16,32,64,128
下面是一些代码。一如既往的感谢您的帮助,谢谢您的关注。在criterion = nn.MSELoss()
def train(args, model, device, train_loader, criterion, optimizer,
epoch):
running_loss = 0.0
total_train_loss = 0.0
model.train()
for batch_idx, batch in enumerate(train_loader):
data = batch['image']
target = batch['key_points']
target = target.view(target.size(0), -1)
data, target = data.to(device), target.to(device)
target = target.type(torch.cuda.FloatTensor)
data = data.type(torch.cu