Faster R-CNN的resize处理

最新推荐文章于 2023-05-25 15:19:09 发布

beeeestlight

最新推荐文章于 2023-05-25 15:19:09 发布

阅读量4.7k

点赞数

分类专栏：目标检测 mxnet 文章标签： Faster R-CNN mxnet resize

本文链接：https://blog.csdn.net/zyxxlyj/article/details/80816300

版权

目标检测同时被 2 个专栏收录

3 篇文章 0 订阅

订阅专栏

mxnet

3 篇文章 0 订阅

订阅专栏

array, scale = resize(im, SHORT_SIDE, LONG_SIDE)

Faster-RCNN对读取的图像进行了scale处理。

im为原始图像，在缩放的过程中，首先，定义scale大小为SHORT_SIDE / im_size_short，如果这个scale的时候，长边的长度超过LONG_SIDE，就将scale定义为LONG_SIDE / im_size_min，否则就还是用原来的scale。

这样做的好处就是输入的图片相对大点，最终对小目标也许效果就会更好，当然这样做的话也会使得运行速度变慢，显存使用增加，对于不同ratio(长宽比)的图片运行时间也有差别。

作者的原始参数：SHORT_SIDE=600 ，LONG_SIDE=1000。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

beeeestlight

关注关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

深度解析：用C++实现简易版Faster R-CNN目标检测模型

m0_57781768的博客

06-02

Faster R-CNN是一种端到端的目标检测模型，由RPN（Region Proposal Network）和Fast R-CNN组成。RPN负责生成候选区域（Region Proposals），而Fast R-CNN则对这些候选区域进行分类和边界框回归。Faster R-CNN相比于早期的R-CNN和Fast R-CNN，有着更高的检测速度和精度。

用progressive resizing提升CNN图像分类器性能

04-05

用progressive resizing提升CNN图像分类器性能，Boost your CNN image classifier performance with progressive resizing in Keras，by Aleksey Bilogur。

3 条评论您还未登录，请先登录后发表或查看评论

2 -【Faster R-CNN】之 Resize_and_Padding 代码精读

weixin_37804469的博客

02-01

767

在上一篇文章【Faster R-CNN】之 Dataset and Dataloader 代码精读中，我们重写了 Dataset 和 Dataloader，可以迭代的读出 batch 数据了。每个batch 中的数据包括 image 和 target，数据形如：接下来，batch 中的 images 要传入 backbone 获得 feature map，但是当前这些 images 存在一个问题，就是这 batch 中的图像的尺寸是不一致的，不能直接喂进 backbone。

深度学习实践-物体检测-faster-RCNN(原理和部分代码说明) 1.tf.image.resize_and_crop(根据比例取出特征层，进行维度变化) 2.tf.slice(数据切片) 3....

weixin_33843409的博客

04-03

451

1. tf.image.resize_and_crop(net, bbox, 256, [14, 14], name) # 根据bbox的y1,x1,y2,x2获得net中的位置，将其转换为14*14，因此为[14, 14, 512], 256表示转换的个数，最后的维度为[256, 14, 14, 512] 参数说明：net表示输入的卷积层，bbox表示y1，x1,y2, x2的比例，256表...

(SPP-Net)CNN处理图片时resize图片尺寸的问题小结

ljmiiianng的博客

09-21

2090

目前已知SPP和RoI pooling CNN中卷积层Conv_Layer对图片size并没有限制, 而全连接层FC_Layer则相反. SPP-Net(空间金字塔池化网络) 背景 SPP-Net是出自2015年发表在IEEE上的论文-《Spatial Pyramid Pooling in Deep ConvolutionalNetworks for Visual Recognition》. 在S...

fast-rcnn,faster-rcnn相关细节

yogyliu的专栏

07-13

1088

详见大神博客http://closure11.com/rcnn-fast-rcnn-faster-rcnn%E7%9A%84%E4%B8%80%E4%BA%9B%E4%BA%8B/ Bounding-box Regression 有了ROI Pooling层其实就可以完成最简单粗暴的深度对象检测了，也就是先用selective search等proposal提取算法得到一批box坐标，

基于Pytorch搭建Faster R-CNN实现飞机目标检测-数据集

01-09

总结来说，本项目涵盖了计算机视觉和深度学习的多个关键知识点，包括Faster R-CNN算法的原理、Pytorch框架的应用、数据集处理、模型训练和测试。通过这个实践，不仅可以深入理解目标检测的流程，还能提升使用Pytorch...

Faster R-CNN网络架构详解和TensorFlow Hub实现（附源码）

专注AI领域

05-25

1549

Faster R-CNN的网络架构详解

目标检测（二）—— R-CNN、Fast R-CNN、Faster R-CNN、Mask R-CNN

qq_38622495的博客

09-06

2777

R-CNN 区域卷积神经网络（Regions with CNN features，简称 R-CNN）使用深度模型来解决物体识别。具体步骤： Sective Search 。对每张输入图像使用选择性搜索来选取多个高质量的提议区域。 Resize。对每个提议区域，将其变形成卷积神经网络需要的输入尺寸。特征抽取。选取一个预先训练好的卷积神经网络，去掉最后的输出层来作为特征抽取模块。 ...

Faster R-CNN详解

张家四少

09-01

1万+

1 前言 Faster RCNN将特征抽取(feature extraction)，proposal提取，bounding box regression，classification都整合在了一个网络中，使得综合性能有较大提高，在检测速度方面尤为明显。图1 Faster RCNN基本结构（来自原论文） 1.1 图1展示了F...

Faster-Rcnn

qq_44836316的博客

05-09

1780

Faster-Rcnn原理（学习笔记）一、从输入到输出 1.1输入：一张图片输入尺寸：作为输入放入网络训练的话需要限制图片的大小，Faster-Rcnn对于输入图像的大小限制规则是：限制最小边为600，最大边为1000，对于输入图像优先考虑最大边的限制。测试时不需要。 1.2处理过程： 1.首先，使用一组covn(卷积)+relu+pooling(池化) 提取输入图像的特征图。（原理看2.1） 2.之后，使用RPN网络（区域生成网络）对上一步生成的特征图进行处理，在特征图上标多个框，通过RP

计算机视觉——FASTER RCNN

sinat_42247418的博客

03-16

898

计算机视觉——FASTER RCNN1、模型作用2、整体框架3、网络结构

PytorchVideo Transforms 详解

清欢

07-10

3160

文章目录0. 前言1. Mix 操作2. 普通操作2.1 Norm 与其他2.2 Sample Strategy2.3 Resize & Crop3. “高端”数据增强4. create_video_transform 0. 前言看到 PytorchVideo 中有 RandAugment 以及 AugMix，我有心把这些引入 MMAction2。在写代码之前，先详细了解下 PyTorchVideo Transforms 的细节。 PytorchVideo Transforms 主要可分为

slowfast源码详解

qq_52053775的博客

10-15

2724

首先取出video_idx, sec_idx, sec, center_idx,center_idx，center_idx指的是该秒对应的图片帧的索引，以第一个视频第1秒为例，前面的video_idx, sec_idx均为0，sec应为902,对应标签文件中开始的视频时间（902秒),center_idx应为30,因为视频在准备数据的时候做了切分，截取了第15分钟到第25分钟的视频,同时每一秒包含30帧图像。此外，为了进行特征融合，在h,w维度k均为7，stride保持一致。并对小数进行双线性插值。

目标检测系列——Faster R-CNN原理详解

秃头小苏的博客

07-03

6455

前文我已经介绍过R-CNN、Fast R-CNN的原理，具体内容可以点击下面链接阅读。【注：阅读此篇之前建议对R-CNN和Fast R-CNN有一定的了解】 Faster R-CNN算是这个目标检测系列的最后一篇了，在速度和准确率上也相对达到了比较好的效果，所以还是非常重要的。后面可能会更新语义分割Mask RCNN，当然这都是后话啦。现在就和我一起来学学Faster R-CNN吧。🍻🍻🍻 不知大家是否还记得Fast R-CNN的流程？这里帮大家回忆一下，其步骤如下：那么Faster...

Faster-Rcnn-TF 输入图像尺寸变换

LoveWeeknd

09-05

9548

Faster-Rcnn本身对于采集的原图像没有要求，但是作为输入放入网络训练的话就必须限制图片的大小，一般Faster-Rcnn对于输入图像的大小限制规则是：限制最小边为600，最大边为1000，对于输入图像优先考虑最大边的限制代码：./lib/utils/blob.py def prep_im_for_blob(im, pixel_means, target_size, max_size...

Faster RCNN总结

年轻即出发，

12-16

8768

faster RCNN选自2015年 NIPS， Faster R-CNN: Towards Real-Time Object Detection withRegion Proposal Networks 正如上图所示，检测不同尺度(scale)，不同长宽比(aspect ratios)的目标物通常的3种做法。（a）Pyramids of images，缩放图像来达到不同的s...

深度学习RCNN, Fast-RCNN, Faster-RCNN的一些事

GarfieldEr007的专栏

04-06

1万+

rbg大神的深度神经网络检测算法系列RCNN、Fast-RCNN、Faster-RCNN可谓是理论与实践的经典范例，论文创新点足够，在github上开源的代码更是造福广大码农，本文以当前最新Faster-RCNN的python实现（https://github.com/rbgirshick/py-faster-rcnn）为准，尝试对rcnn系列算法中的几个关键核心点进行详细的分析： RCNN

Faster R-CNN 源码解析（Tensorflow版）

最新发布

05-29

以下是使用PyTorch实现Faster R-CNN的Python代码示例： ``` import torch import torchvision import torchvision.transforms as transforms import torchvision.datasets as datasets import torchvision.models as models import torch.nn as nn import torch.optim as optim from torch.utils.data import DataLoader # 定义Faster R-CNN模型 class FasterRCNN(nn.Module): def __init__(self): super(FasterRCNN, self).__init__() self.features = models.vgg16(pretrained=True).features self.roi_pooling = nn.AdaptiveMaxPool2d((7, 7)) self.classifier = nn.Sequential( nn.Linear(512 * 7 * 7, 4096), nn.ReLU(True), nn.Dropout(), nn.Linear(4096, 4096), nn.ReLU(True), nn.Dropout(), nn.Linear(4096, 21) ) self.bbox = nn.Sequential( nn.Linear(512 * 7 * 7, 4096), nn.ReLU(True), nn.Dropout(), nn.Linear(4096, 4096), nn.ReLU(True), nn.Dropout(), nn.Linear(4096, 84) ) def forward(self, x, proposals): x = self.features(x) rois = [] for i in range(proposals.shape[0]): roi = proposals[i] x1, y1, x2, y2 = roi.tolist() roi_feature = x[:, :, int(y1):int(y2), int(x1):int(x2)] roi_feature = self.roi_pooling(roi_feature) rois.append(roi_feature) rois = torch.stack(rois, dim=0) rois = rois.view(-1, 512 * 7 * 7) cls_score = self.classifier(rois) bbox_pred = self.bbox(rois) return cls_score, bbox_pred # 加载数据集 transform = transforms.Compose([ transforms.Resize((224, 224)), transforms.ToTensor(), transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]) ]) train_dataset = datasets.CocoDetection(root='./data', annFile='./annotations/instances_train2017.json', transform=transform) train_loader = DataLoader(train_dataset, batch_size=16, shuffle=True) # 定义优化器和损失函数 model = FasterRCNN() optimizer = optim.Adam(model.parameters(), lr=0.001) criterion = nn.CrossEntropyLoss() # 训练模型 for epoch in range(10): for i, (images, targets) in enumerate(train_loader): optimizer.zero_grad() cls_score, bbox_pred = model(images, targets) loss_cls = criterion(cls_score, targets) loss_bbox = criterion(bbox_pred, targets) loss = loss_cls + loss_bbox loss.backward() optimizer.step() print('Epoch [{}/{}], Step [{}/{}], Loss: {:.4f}'.format(epoch+1, 10, i+1, len(train_loader), loss.item())) ``` 请注意，这只是一个简单的示例，实际使用时需要根据数据集和模型的特点进行相应的修改。