Faster-CNN思路梳理(2)

本文深入解析Faster R-CNN的工作原理,涵盖RPN的锚点匹配、NMS、损失计算,以及ROI Pooling的操作细节。探讨RPN的分类和回归任务,强调其在目标检测中的关键角色,并讨论了优化器和验证过程的特点。
摘要由CSDN通过智能技术生成

代码目录:https://github.com/chenyuntc/simple-faster-rcnn-pytorch
详细解读:https://blog.csdn.net/qq_31355669/article/details/96832027

train.py没什么说的,主要的训练,每次epoch进行验证。
主要是trainer,将模块的加载以及loss的计算,都在这块
rpn中的propasal creator使用nms模块
roi_indices:在本项目中没有作用

    bbox = bboxes[0]#bbox维度( R, 4)
    label = labels[0]#labels维度为(R,1)
    rpn_score = rpn_scores[0] #(H/16*W/16*9,2)
    rpn_loc = rpn_locs[0] #(H/16*W/16**9,4)
    roi = rois  #(大约2000,4)(应图片的大小的不同而不同)

此代码确定了每次只有一张图片参加训练。。。。。。。。。。。

RPN:得到nms后的前大约2000个bbox的中心点以及的长宽,(NMS:锚点加上偏移值,得到目标bbox,后使用前景的概率进行排序,训练选前12000个roi,nms则是分别计算两两的iou,iou太高则排除,留下iou低的(可自己设置阀值))
rpn_scores:网络输出后,softmax后二分类的概率
rpn_scores:torch.size(batch,H/16W/169,2)
rpn_locs:直接是网络的输出的值,即:网络的回归值 #torch.size((batch,H/16W/169,4))

RPN Losses
loss计算,去除了batch,batch为1
调用anchor_target_creator函数,bbox为(R,4)
ious:(H/16W/169,R)
inside_index:在图片范围内的锚点的索引
argmax_ious:(inside_index,1)获得每

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值