pytorch 从头开始faster-rcnn（五）：roi

最新推荐文章于 2023-03-22 14:04:57 发布

冰菓(笑)

最新推荐文章于 2023-03-22 14:04:57 发布

阅读量1.9k

点赞数 3

分类专栏：目标检测 faster-rcnn

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/a362682954/article/details/82928568

版权

本文介绍了在PyTorch中实现Faster R-CNN时ROI层的工作原理。主要内容包括：利用RPN产生的ROI与VGG16特征图进行ROI Pooling，生成固定尺寸7*7的特征图，进行分类和定位任务。通过金字塔池化处理，以适应不同大小的ROI，同时提到了双线性插值在处理非整数比例时的作用。虽然作者表示部分细节未完全理解，但文章概述了ROI处理的主要步骤，包括nms后的ROI选取、空间金字塔池化以及ROI Loc和Scores的计算。

摘要由CSDN通过智能技术生成

更新：2019/8/12

上文说到

最终获得的检测框将用于ROI层真值标签的生成，以及进行筛选3：1的正负样本放入ROI层进行训练（共128个）；

同时进入ROI层的还有vgg16生成的特征图，这个特征图用于上面说的3：1正负样本坐标将相应位置的特征图抠出来用于ROIpooling层进行金字塔池化，通过金字塔池化生成固定尺寸大小（7*7）特征图；在用来全连接层分类和定位，计算损失方式与PRN层类似，只是这里换成了21类（前景20类+背景1类）；

金字塔池化使用的是核大小分别是w/7,h/7（w,h为特征图大小），步长为w/7,h/7；这样就能产生7*7的大小的特征图；

ps：w/7取整了，也就是说有一部分特征图是没有使用的；所以产生了align pooling 采用双线性插值来避免像素值除以不整的情况；

---------------------------------------------------------------------------------------------------------------------------------------------------

由于能力有限，这部分很多都没看懂，只能把自己看懂的部分写出来。供大家查看其大概想要干什么。

大概步骤为：

1.将前面rpn获得的通过nms极大值抑制获得符合条件的roi（这里ROI个数为2000个）及其标签，还有vgg16出来的特征图进行空间金字塔池化。

2.分别输入进roi_loc和roi_scores获得roi坐标和评分（到这里就有128个

最低0.47元/天解锁文章

关注

3
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
pytorch 从头开始faster-rcnn（五）：roi

更新：2019/8/12上文说到最终获得的检测框将用于ROI层真值标签的生成，以及进行筛选3：1的正负样本放入ROI层进行训练（共128个）；同时进入ROI层的还有vgg16生成的特征图，这个特征图用于上面说的3：1正负样本坐标将相应位置的特征图抠出来用于ROIpooling层进行金字塔池化，通过金字塔池化生成固定尺寸大小（7*7）特征图；在用来全连接层分类和定位，计算损失方式与PRN...
复制链接

扫一扫

专栏目录

冰菓(笑) CSDN认证博客专家 CSDN认证企业博客

码龄9年

132: 原创

3万+: 周排名

176万+: 总排名

49万+: 访问

: 等级

5988: 积分

154: 粉丝

224: 获赞

236: 评论

907: 收藏

私信

关注

热门文章

分类专栏

NLP 1篇
软件环境安装 2篇
深度学习 8篇
tensorflow 4篇
部署
爬虫 1篇
darknet 1篇
ocr 1篇
机器学习 13篇
python 17篇
ubuntu 8篇
研电赛 4篇
医疗图像 6篇
pytorch 24篇
opencv 12篇
论文修改 3篇
incremental learning 6篇
keras 7篇
目标检测 40篇
算法 21篇
C++ 23篇
知识蒸馏 2篇
faster-rcnn 7篇
YOLOV3 5篇
每周论文阅读 3篇
图像处理 7篇

最新评论

pytorch: DiceLoss MulticlassDiceLoss
YorkCOSYAO: 如果loss依然为负数也没有关系，（我猜想大概率仍然是smooth取得不合理）。直接用负loss一样可以实现优化： class dice_coef(nn.Module): def __init__(self): super(dice_coef, self).__init__() def forward(self, y_true, y_pred, smooth=1e-7): y_true_f = y_true.flatten() y_pred_f = y_pred.flatten() intersection = torch.sum(y_true_f * y_pred_f) return (2. * intersection + smooth) / (torch.sum(y_true_f) + torch.sum(y_pred_f) + smooth) class dice_coef_multilabel(nn.Module): def __init__(self): super(dice_coef_multilabel, self).__init__() def forward(self, y_true, y_pred, numLabels=3): dice = 0 for index in range(3): dice -= dice_coef()(y_true[:, index], y_pred[:, index]) return dice
pytorch: DiceLoss MulticlassDiceLoss
YorkCOSYAO: 出现负值的原因是因为smooth，参考用户‘孙良怀’的评论：loss = 2 * (intersection.sum(1) + smooth) / (input_flat.sum(1) + target_flat.sum(1) + smooth) 我认为应该写作： loss = (2*intersection.sum(1) + smooth) / (input_flat.sum(1) + target_flat.sum(1) + smooth) 。smooth应该加在括号里面。不然分子加了两个smooth，分母只加了一个
pytorch 自己的图片数据处理成可以训练的图片类型
编程进阶0.1: from torch.utils.data import Dataset import numpy as np class Dataset(Dataset): def __init__(self, path_img, path_target, transforms=None): self.train = path_img self.targets = path_target self.transforms = transforms def __len__(self): return len(self.train) def __getitem__(self, idx): img = self.train[idx] target = self.targets[idx] if self.transforms: img = self.transforms(img) target = self.transforms(target) return img, target 可以说一下这段代码的原理吗？
关于pytorch 模型复制的一些问题
cyh19971997: 在循环里deepcopy造成显存飙升最后CUDA 显存炸了。你遇见过吗
pytorch 从头开始faster-rcnn 最后：使用自己的数据集
晴明大大: 好久了，我也忘了

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。