py faster rcnn训练 VGG_CNN_M_1024记录

本文记录了在Ubuntu16.04系统,使用CPU环境对VGG_CNN_M_1024模型进行Faster R-CNN训练的过程。主要步骤包括修改相关配置文件、调整迭代次数、设置绝对路径以及训练和测试的详细操作。训练完成后,通过demo.py进行验证。
摘要由CSDN通过智能技术生成

ZF网络已经训练通过,参考训练ZF的步骤修改相关文件。环境:CPU+ Ubuntu16.04

1、修改py-faster-rcnn/models/pascal_voc/VGG_CNN_M_1024/faster_rcnn_alt_opt/stage1_fast_rcnn_train.pt & stage2_fast_rcnn_train.pt

layer {
  name: 'data'
  type: 'Python'
  top: 'data'
  top: 'rois'
  top: 'labels'
  top: 'bbox_targets'
  top: 'bbox_inside_weights'
  top: 'bbox_outside_weights'
  python_param {
    module: 'roi_data_layer.layer'
    layer: 'RoIDataLayer'
    param_str: "'num_classes': 2"#original is 21 ,class_num + 1  
  }
}
layer {
  name: "cls_score"
  type: "InnerProduct"
  bottom: "fc7"
  top: "cls_score"
  param { lr_mult: 1 }
  param { lr_mult: 2 }
  inner_product_param {
    num_output: 2 # origial is 21, class_num + 1
    weight_filler {
      type: "gaussian"
      std: 0.01
    }
    bias_filler {
      type: "constant"
      value: 0
    }
  }
}
layer {
  name: "bbox_pred"
  type: &#
Fast R-CNN with ResNet50 FPN是一种基于深度学习的目标检测模型,它结合了Faster R-CNN(区域卷积神经网络)的快速候选区生成策略和ResNet50网络的深度特征提取能力,再加上Feature Pyramid Network(FPN)来处理不同尺度的目标。它的训练过程主要包括以下几个步骤: 1. **数据准备**:首先需要标注的数据集,如PASCAL VOC、COCO等,其中包含图像及其对应的物体类别和边界框信息。 2. **预处理**:对输入图像进行归一化、裁剪、大小调整等操作,以便适应模型的需求。 3. **模型初始化**:使用预训练好的ResNet50作为基础特征提取器,其权重通常在ImageNet上进行迁移学习。 4. **训练流程**: - **RPN(Region Proposal Network)**:生成一系列可能包含目标的候选区域。 - **RoI Pooling**:对每个候选区域取固定大小的特征池化。 - **分类层**:将每个RoI的特征映射到特定类别。 - **回归层**:预测每个候选区域的精确位置(边界框的调整)。 - **损失函数**:结合两个阶段的损失(分类损失和边界框回归损失)进行优化。 5. **迭代训练**:通过反向传播更新网络参数,通常采用随机梯度下降或其他优化算法进行多次迭代,直到满足停止条件(如达到预定的迭代次数或验证性能不再提升)。 6. **评估和微调**:训练完成后,在验证集上评估模型性能,并可能在某些部分进行微调以提高特定任务的表现。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值