pytorch 从头开始faster-rcnn（四）：rpn

最新推荐文章于 2024-05-26 17:00:37 发布

冰菓(笑)

最新推荐文章于 2024-05-26 17:00:37 发布

阅读量3.4k

点赞数 4

分类专栏：目标检测 pytorch faster-rcnn

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/a362682954/article/details/82855868

版权

具体参数可以查看：https://www.cnblogs.com/wangyong/p/8513563.html

RPN流程：

1.每一张图片生成固定数量的锚节点,锚节点个数是最后一次特征图大小,比如说最后一层特征大小为(37,50),所以有37*50个锚节点.锚节点之间的步长为16像素点,这是因为vgg16有4次maxpool,所有图像缩小了16倍,所以步长为16像素。每一个锚节点又生成9个区域图,所以生成的锚节点区域图就有9*37*50个.

2.如图1左，通过卷积特征生成2*锚节点个数（通道数）scores和4**锚节点个数（通道数）坐标；这里坐标是相对对应锚节点的偏差量。

这个预测值将与真值标签计算损失；这里真值标签的制作为真值标签与锚节点重叠度最大的作为真值，计算偏差量，与预测值获得的偏差量进行计算。

由于锚节点框数量太多，所以是又进行筛选进行计算的：

① 去除掉超过1000*600这原图的边界的anchor box

② 如果anchor box与ground truth的IoU值最大，标记为正样本，label=1

最低0.47元/天解锁文章

关注

4
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
pytorch 从头开始faster-rcnn（四）：rpn

具体参数可以查看：https://www.cnblogs.com/wangyong/p/8513563.htmlRPN流程：1.每一张图片生成固定数量的锚节点,锚节点个数是最后一次特征图大小,比如说最后一层特征大小为(37,50),所以有37*50个锚节点.锚节点之间的步长为16像素点,这是因为vgg16有4次maxpool,所有图像缩小了16倍,所以步长为16像素。每一个锚节点又生成9个...
复制链接

扫一扫

专栏目录

冰菓(笑) CSDN认证博客专家 CSDN认证企业博客

码龄9年

132: 原创

3万+: 周排名

97万+: 总排名

49万+: 访问

: 等级

5985: 积分

154: 粉丝

224: 获赞

236: 评论

907: 收藏

私信

关注

热门文章

分类专栏

NLP 1篇
软件环境安装 2篇
深度学习 8篇
tensorflow 4篇
部署
爬虫 1篇
darknet 1篇
ocr 1篇
机器学习 13篇
python 17篇
ubuntu 8篇
研电赛 4篇
医疗图像 6篇
pytorch 24篇
opencv 12篇
论文修改 3篇
incremental learning 6篇
keras 7篇
目标检测 40篇
算法 21篇
C++ 23篇
知识蒸馏 2篇
faster-rcnn 7篇
YOLOV3 5篇
每周论文阅读 3篇
图像处理 7篇

最新评论

pytorch: DiceLoss MulticlassDiceLoss
YorkCOSYAO: 如果loss依然为负数也没有关系，（我猜想大概率仍然是smooth取得不合理）。直接用负loss一样可以实现优化： class dice_coef(nn.Module): def __init__(self): super(dice_coef, self).__init__() def forward(self, y_true, y_pred, smooth=1e-7): y_true_f = y_true.flatten() y_pred_f = y_pred.flatten() intersection = torch.sum(y_true_f * y_pred_f) return (2. * intersection + smooth) / (torch.sum(y_true_f) + torch.sum(y_pred_f) + smooth) class dice_coef_multilabel(nn.Module): def __init__(self): super(dice_coef_multilabel, self).__init__() def forward(self, y_true, y_pred, numLabels=3): dice = 0 for index in range(3): dice -= dice_coef()(y_true[:, index], y_pred[:, index]) return dice
pytorch: DiceLoss MulticlassDiceLoss
YorkCOSYAO: 出现负值的原因是因为smooth，参考用户‘孙良怀’的评论：loss = 2 * (intersection.sum(1) + smooth) / (input_flat.sum(1) + target_flat.sum(1) + smooth) 我认为应该写作： loss = (2*intersection.sum(1) + smooth) / (input_flat.sum(1) + target_flat.sum(1) + smooth) 。smooth应该加在括号里面。不然分子加了两个smooth，分母只加了一个
pytorch 自己的图片数据处理成可以训练的图片类型
编程进阶0.1: from torch.utils.data import Dataset import numpy as np class Dataset(Dataset): def __init__(self, path_img, path_target, transforms=None): self.train = path_img self.targets = path_target self.transforms = transforms def __len__(self): return len(self.train) def __getitem__(self, idx): img = self.train[idx] target = self.targets[idx] if self.transforms: img = self.transforms(img) target = self.transforms(target) return img, target 可以说一下这段代码的原理吗？
关于pytorch 模型复制的一些问题
cyh19971997: 在循环里deepcopy造成显存飙升最后CUDA 显存炸了。你遇见过吗
pytorch 从头开始faster-rcnn 最后：使用自己的数据集
晴明大大: 好久了，我也忘了

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。