使用Faster-RCNN进行指定GPU训练(续)

  1. 今天接着昨天的实验继续跑“多GPU训练”

    python trainval_net.py \ --dataset pascal_voc --net res101 \ --bs 24 --nw 8 \ --lr $LEARING_RATE --lr_decay_step $DECAY_STEP \ --cuda --mGPUs
    # (pascal_voc.py    self._classes   类别修改)
    
  2. 训练自己的数据集(步骤与之前样例中相同)

  3. 训练完成后对数据集进行处理,发现有些图片因为亮度不够或模糊而识别有误。下一步考虑怎么提高图片的清晰度,使识别率提高。

  4. 目前有个想法:

    1. 计算图片清晰度,如果清晰度不在某个范围的话,进行第二步操作;
    2. 调整图片的亮度和对比度,然后再进行清晰度计算。若清晰度达到要求,则输出;否则,继续调整,直到符合要求。

问题

  • 问题一:“多GPU训练”中出现ctx.input_sizes = tuple(map(lambda i: i.size(ctx.dim), inputs)) RuntimeError: dimension specified as 0 but tensor has no dimensions错误

    • 解决:在faster-rcnn.pytorch中的issue: multi gpu train errors!可以看到这个问题出现的比较多,其中有两条解决方案:

      1. the pytorch 1.0 branch works fine with multi GPU training(pytorch 1.0分支可以正常进行多GPU训练)。但因为太麻烦,我没有尝试。

      2. faster-rcnn.pytorch/lib/model/faster_rcnn/faster_rcnn.py中加入以下几行(经测试可行):

        rpn_loss_cls = torch.Tensor([0]).cuda() + rpn_loss_cls
        rpn_loss_bbox = torch.Tensor([0]).cuda() + rpn_loss_bbox
        RCNN_loss_cls = torch.Tensor([0]).cuda() + RCNN_loss_cls
        RCNN_loss_bbox = torch.Tensor([0]).cuda() + RCNN_loss_bbox
        
  • 问题二:assert (boxes[:, 2] >= boxes[:, 0]).all() AssertionError

    • 解决:将datasets/pascal_voc.py中的如下代码的"-1"删掉

      bbox = obj.find('bndbox')
      # Make pixel indexes 0-based
      x1 = float(bbox.find('xmin').text) - 1
      y1 = float(bbox.find('ymin').text) - 1
      x2 = float(bbox.find('xmax').text) - 1
      y2 = float(bbox.find('ymax').text) - 1
      
      
  • 问题三:raise ValueError("bg_num_rois = 0 and fg_num_rois = 0, this should not happen!")

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值