MultiScaleRoIAlign

这几天在看一个代码,看到这个方法,官方给的代码样例:

        >>> m = torchvision.ops.MultiScaleRoIAlign(['feat1', 'feat3'], 3, 2)
        >>> i = OrderedDict()
        >>> i['feat1'] = torch.rand(1, 5, 64, 64)
        >>> i['feat2'] = torch.rand(1, 5, 32, 32)  # this feature won't be used in the pooling
        >>> i['feat3'] = torch.rand(1, 5, 16, 16)
        >>> # create some random bounding boxes
        >>> boxes = torch.rand(6, 4) * 256; boxes[:, 2:] += boxes[:, :2]
        >>> # original image size, before computing the feature maps
        >>> image_sizes = [(512, 512)]
        >>> output = m(i, [boxes], image_sizes)
        >>> print(output.shape)
        >>> torch.Size([6, 5, 3, 3])

当时很奇怪,输入除了 feat2 不要用,feat1,feat3都要用,但是我当时很奇怪的是:明明两个featuremap,按理输出的shape应该是 shape= [12,5,3,4],为啥是[6, 5, 3, 3]?

我当时的想法是,有两个feature map,那6个box应该分别在每个feature map上进行找box对应区域这个想法是错的,下图见解:

  

而且在RPN给出的rois时,给几个box,就会在上面初始化 MultiScaleRoIAlign 方法时确定(rois给几个,这个是确定好的),接着result中就会有几个key,不会出现覆盖。

虽然简单记录了,也不知道别人能不能看懂,但是困扰我有好久了,昨天晚上到今天终于搞懂了。

为数不多找到的参考:
​​​​​​​从源码学习 Faster-RCNN - 刘知安的博客 | LiuZhian's Blog

保姆级 faster rcnn 源码逐行解读 (五)roi_head part1 - 知乎

捋一捋pytorch官方FasterRCNN代码 - 知乎

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
multiscaleroialign是一种在机器学习中使用的多尺度对齐算法。该算法通过对数据进行多次尺度的变换和对齐,以得到更准确和鲁棒的结果。 在传统的机器学习中,常常使用单一尺度的特征进行建模和训练。然而,存在着不同尺度之间的信息关联和互补性。multiscaleroialign通过引入多尺度的概念,可以更好地捕捉这些信息关联。 该算法的核心思想是先将原始数据进行分解,得到不同尺度的表示。例如,在图像处理中,可以对图像进行金字塔分解,得到不同尺度的图像。然后,通过对这些不同尺度的数据进行对齐操作,使得它们具有一致的模式和结构。 多尺度对齐可以通过不同的方式实现,常见的方法包括金字塔变换、小波变换等。这些方法可以帮助我们发现数据中的局部和全局的模式,并将它们整合为一个更全面的表示。 multiscaleroialign的应用非常广泛。例如,在计算机视觉领域,它可以用于图像识别、目标检测等任务,通过对不同尺度的图像进行对齐,可以提高识别和检测的准确性。在自然语言处理领域,它可以用于文本分类、情感分析等任务,通过对不同尺度的文本进行对齐,可以提取更丰富和准确的语义特征。 总之,multiscaleroialign是一种在机器学习中使用的多尺度对齐算法,通过对不同尺度的数据进行变换和对齐,可以提高模型的准确性和鲁棒性,广泛应用于各个领域和任务中。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值