【6PACK代码注解】train.py

momo_vv

已于 2022-08-06 13:21:42 修改

阅读量540

点赞数 1

分类专栏： 6pack 文章标签：深度学习人工智能 python 计算机视觉

于 2022-08-04 10:47:12 首次发布

本文链接：https://blog.csdn.net/weixin_44695308/article/details/125930580

版权

6pack 专栏收录该内容

9 篇文章 2 订阅

订阅专栏

文章目录

前言
train.py

前言

【6PACK全记录】6-PACK论文学习及复现记录
常见遍历epoch训练的模型：

model = MyModel()
criterion = nn.CrossEntropyLoss()
optimizer = torch.optim.SGD(model.parameters(), lr=0.001, momentum=0.9, weight_decay=1e-4)

for epoch in range(1, epochs):
    for i, (inputs, labels) in enumerate(train_loader):
        output= model(inputs)
        loss = criterion(output, labels)
        
        # compute gradient and do SGD step
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

train.py

一、超参数设置：

parser = argparse.ArgumentParser() #实例化参数解析器parser
#添加参数
parser.add_argument('--dataset_root', type=str, default = 'My_NOCS', help='dataset root dir')
parser.add_argument('--resume', type=str, default = '',  help='resume model') 
parser.add_argument('--category', type=int, default = 5,  help='category to train') 
parser.add_argument('--num_points', type=int, default = 500, help='points')
parser.add_argument('--num_cates', type=int, default = 6, help='number of categories')
parser.add_argument('--workers', type=int, default = 5, help='number of data loading workers')
parser.add_argument('--num_kp', type=int, default = 8, help='number of kp')
parser.add_argument('--outf', type=str, default = 'models/', help='save dir')
parser.add_argument('--lr', default=0.0001, help='learning rate')
opt = parser.parse_args() #解析后的参数

超参数含义：

-dataset_root：数据集根路径
-resume：此前保存的训练过的模型
-category：训练的物体类型
-num_points：点云中的点数
-num_cates：物体类别总数，我们的数据集中有6种
-workers：同时工作的线程数
-num_kp：每个实例需要提取的关键点数
-outf：模型保存的路径

二、模型加载：

若resume不为空则加载已经训练好的模型，否则使用network.py中的KeyNet进行训练

model = KeyNet(num_points = opt.num_points, num_key = opt.num_kp, num_cates = opt.num_cates)
model.cuda()

if opt.resume != '':
    model.load_state_dict(torch.load('{0}/{1}'.format(opt.outf, opt.resume)))#加载已经训练好的模型

三、数据集加载：

分别加载训练集（5000样本）和验证集（1000样本），其中训练集加入随机噪声干扰
两者均在1个batch中加载

dataset = Dataset('train', opt.dataset_root, True, opt.num_points, opt.num_cates, 5000, opt.category)#5000是训练集的样本数
dataloader = torch.utils.data.DataLoader(dataset, batch_size=1, shuffle=True, num_workers=opt.workers)
test_dataset = Dataset('val', opt.dataset_root, False, opt.num_points, opt.num_cates, 1000, opt.category)
testdataloader = torch.utils.data.DataLoader(test_dataset, batch_size=1, shuffle=True, num_workers=opt.workers)

四、遍历500个epoch训练，每个epoch中先训练再验证：

4.1 训练

for i, data in enumerate(dataloader, 0):
        img_fr, choose_fr, cloud_fr, r_fr, t_fr, img_to, choose_to, cloud_to, r_to, t_to, mesh, anchor, scale, cate = data
        img_fr, choose_fr, cloud_fr, r_fr, t_fr, img_to, choose_to, cloud_to, r_to, t_to, mesh, anchor, scale, cate = Variable(img_fr).cuda(), \
                                                                                                                     Variable(choose_fr).cuda(), \
                                                                                                                     Variable(cloud_fr).cuda(), \
                                                                                                                     Variable(r_fr).cuda(), \
                                                                                                                     Variable(t_fr).cuda(), \
                                                                                                                     Variable(img_to).cuda(), \
                                                                                                                     Variable(choose_to).cuda(), \
                                                                                                                     Variable(cloud_to).cuda(), \
                                                                                                                     Variable(r_to).cuda(), \
                                                                                                                     Variable(t_to).cuda(), \
                                                                                                                     Variable(mesh).cuda(), \
                                                                                                                     Variable(anchor).cuda(), \
                                                                                                                     Variable(scale).cuda(), \
                                                                                                                     Variable(cate).cuda()

        Kp_fr, anc_fr, att_fr = model(img_fr, choose_fr, cloud_fr, anchor, scale, cate, t_fr) #调用keynet中的forward()训练，输出all_kp_x, output_anchor, att_x
        Kp_to, anc_to, att_to = model(img_to, choose_to, cloud_to, anchor, scale, cate, t_to)
        #kp:关键点坐标（实际，非归一化）
        #anc：锚点坐标（实际，非归一化）
        #att：锚点置信分数

        #loss.forward()
        loss, _ = criterion(Kp_fr, Kp_to, anc_fr, anc_to, att_fr, att_to, r_fr, t_fr, r_to, t_to, mesh, scale, cate)
        loss.backward()

        train_dis_avg += loss.item() 
        train_count += 1

        if train_count != 0 and train_count % 8 == 0: #每8个作为1个mini-batch
            optimizer.step() #根据当前梯度优化更新参数
            optimizer.zero_grad() #梯度清空
            print(train_count, float(train_dis_avg) / 8.0) 
            train_dis_avg = 0.0

        if train_count != 0 and train_count % 100 == 0: #每100个保存一次当前模型，如训练过程终端，可以从这里开始
            torch.save(model.state_dict(), '{0}/model_current_{1}.pth'.format(opt.outf, cate_list[opt.category-1]))

该过程中每8个样本作为一个mini-batch进行梯度下降和参数更新，并输出该epoch中当前训练的次数和平均误差。输出形式如下：
在这里插入图片描述
前8行是遍历dataloader时dataset_nocs.py中输出的：

print(tmp_cate_id, item)

之后为输出的训练次数和平均误差。
为防止训练过程中断而被迫重新开始的情况，每训练100个样本保存当前模型，如中断，可以通过“–resume”参数载入最新模型。

4.2 验证

optimizer.zero_grad()
    model.eval() #切换到eval模式，关闭 batch normalization 和 dropout
    score = []
    for j, data in enumerate(testdataloader, 0):
        img_fr, choose_fr, cloud_fr, r_fr, t_fr, img_to, choose_to, cloud_to, r_to, t_to, mesh, anchor, scale, cate = data
        img_fr, choose_fr, cloud_fr, r_fr, t_fr, img_to, choose_to, cloud_to, r_to, t_to, mesh, anchor, scale, cate = Variable(img_fr).cuda(), \
                                                                                                                     Variable(choose_fr).cuda(), \
                                                                                                                     Variable(cloud_fr).cuda(), \
                                                                                                                     Variable(r_fr).cuda(), \
                                                                                                                     Variable(t_fr).cuda(), \
                                                                                                                     Variable(img_to).cuda(), \
                                                                                                                     Variable(choose_to).cuda(), \
                                                                                                                     Variable(cloud_to).cuda(), \
                                                                                                                     Variable(r_to).cuda(), \
                                                                                                                     Variable(t_to).cuda(), \
                                                                                                                     Variable(mesh).cuda(), \
                                                                                                                     Variable(anchor).cuda(), \
                                                                                                                     Variable(scale).cuda(), \
                                                                                                                     Variable(cate).cuda()

        Kp_fr, anc_fr, att_fr = model(img_fr, choose_fr, cloud_fr, anchor, scale, cate, t_fr)
        Kp_to, anc_to, att_to = model(img_to, choose_to, cloud_to, anchor, scale, cate, t_to)

        _, item_score = criterion(Kp_fr, Kp_to, anc_fr, anc_to, att_fr, att_to, r_fr, t_fr, r_to, t_to, mesh, scale, cate)
        
        print(item_score)
        score.append(item_score)