FPN结构详解

没有不重的名么

于 2024-09-18 11:13:06 发布

阅读量181

点赞数 9

分类专栏：目标检测文章标签：目标检测深度学习计算机视觉

本文链接：https://blog.csdn.net/m0_61595251/article/details/142328143

版权

目标检测专栏收录该内容

2 篇文章 0 订阅

订阅专栏

FPN

featurized image pyramid：

针对检测不同尺度的图片会将图片缩放为不同的尺度

问题：

生成多少个尺度就要重新去预测多少次，效率低

single feature map：

高斯金字塔标准的fast-rcnn流程

将图片通过backbone得到最终特征图，在最终特征图上进行预测

问题：

小目标预测效果差

pyramidal feature hierarchy：

类似于ssd

一张图片输入给backbone，在正向传播的特征图上分别去进行预测

Fpn结构：

并不是简单的图像在backbone 上进行特征预测，而是将不同特征图的特征进行融合，融合后的特征图再进行一个预测，有助于提升网络效果

如何融合：

针对每一个backbone都会使用一个1*1的卷积层（调整backbone上不同特征图的channel，保证相同的shape）进行一个特征图的处理

特征图都是进行2的整数倍进行提取28*28 -> 14*14 ->7*7，融合前，针对上面的特征图进行上采样：

7*7 （二倍上采样）-> 14*14 28*28（1*1卷积）-> 14*14 变为一样的shape

二倍上采样实现过程：

临近插值算法

Faster-rcnn视作 rpn+fast-rcnn

Proposal：区域建议，从图中初步预测的rew有目标存在的区域=候选框

通过rpn结构在p2-p6上进行proposal预测，将结果映射到p2-p5上，再通过faster-rcnn得到预测结果

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

没有不重的名么

关注关注

9
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

二阶段目标检测网络-FPN 详解

专注计算机视觉算法训练，算法优化部署以及SDK开发的知识分享。

09-09

903

FPN(feature pyramid networks) 是何凯明等作者提出的适用于多尺度目标检测算法。原来多数的 object detection 算法（比如 faster rcnn）都是只采用顶层特征做预测，但我们知道低层的特征语义信息比较少，但是目标位置准确；高层的特征语义信息比较丰富，但是目标位置比较粗略。另外虽然也有些算法采用多尺度特征融合的方式，但是一般是采用融合后的特征做预测，而本文不一样的地方在于预测是在不同特征层独立进行的。

1.1.2 FPN结构详解

qq_45825952的博客

09-19

664

随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。来源于哔哩哔哩博主“霹雳吧啦Wz”，博主学习作为笔记记录，欢迎大家一起讨论学习交流。

参与评论您还未登录，请先登录后发表或查看评论

18_特征金字塔网络FPN结构详解

https://github.com/foxpup11?tab=repositories

07-07

1830

https://www.bilibili.com/video/BV1dh411U7D9/?spm_id_from=333.999.0.0&vd_source=7dace3632125a1ef7fd32c285eb2fbac

深度学习之目标检测（三）-- FPN结构详解

木卯_THU的博客

08-06

8788

深度学习之目标检测（三）-- FPN结构详解深度学习之目标检测（三）FPN结构详解1. FPN —— 特征金字塔 深度学习之目标检测（三）FPN结构详解本章学习 FPN 相关知识，学习视频源于 Bilibili。 1. FPN —— 特征金字塔 FPN 原始论文为发表于 2016 CVPR 的 Feature Pyramid Networks for Object Detection。针对目标检测任务，主要解决的问题是目标检测在处理多尺度变化问题时的不足，最终在COCOAp 提升 2.3 个点，pasc

目标检测之FPN网络详解

小白学视觉

08-18

1万+

点击上方“小白学视觉”，选择加"星标"或“置顶”重磅干货，第一时间送达特征图金字塔网络FPN（Feature Pyramid Networks）是2017年提出的一种网...

FPN网络详解

热门推荐

kk123k的博客

01-21

7万+

特征图金字塔网络FPN（Feature Pyramid Networks）是2017年提出的一种网络，FPN主要解决的是物体检测中的多尺度问题，通过简单的网络连接改变，在基本不增加原有模型计算量的情况下，大幅度提升了小物体检测的性能。低层的特征语义信息比较少，但是目标位置准确；高层的特征语义信息比较丰富，但是目标位置比较粗略。另外虽然也有些算法采用多尺度特征融合的方式，但是一般是采用融合后的特...

FPN算法详解

woduitaodong2698的博客

12-21

3284

FPN算法详解算法背景简介特征提取算法对比特征图片金字塔单一特征映射金字塔特征分层特征金字塔总结算法详解自底向上的下采样自顶向下的上采样与横向连接算法应用RPNFast R-CNN算法结构算法背景论文全称：FeaturePyramidNetworksforObjectDetection 论文链接：https://arxiv.org/abs/1612.03144 论文时间：2017.5.19 简...

FPN网络详解——feature pyramid network

stu_shanghui的博客

06-14

6020

FPN: feature pyramid networks FPN网络有效的解决了物体检测中多尺度问题；底层特征图中的信息较少，但是目标位置准确，高层特征图信息丰富，但是位置比较粗略，FPN不同的地方在于在不同的特征层独立进行预测目前提取特征的网络结构: 1.简单CNN，最后一层预测如：SSPNet(使网络可以输入任意大小的图形), Fast-RCNN,Faster-RCNN,...

FPN_FPN_

09-29

**FPN：特征金字塔网络详解** 特征金字塔网络（Feature Pyramid Network, FPN）是由林宇航等人在2017年提出的一种深度学习框架，主要用于解决目标检测中的尺度问题。在传统的卷积神经网络（CNN）中，高层特征图具有...

基于深度学习的多模态信息检索

weixin_42605076的博客

09-13

1263

基于深度学习的多模态信息检索技术，通过多模态特征的提取、融合和匹配，实现了从多种数据模态中进行高效检索的能力。随着深度学习技术的不断进步，特别是注意力机制和变换器架构的应用，多模态信息检索将在多个领域展现出更广泛的应用前景和潜力。

机器学习与深度学习的区别

警警的博客

09-14

1555

机器学习与深度学习

【深度学习】【OnnxRuntime】【Python】模型转化、环境搭建以及模型部署的详细教程

yangyu0515的博客

09-13

1483

【深度学习】【OnnxRuntime】【python】模型转化、环境搭建以及模型部署的详细教程

深度学习实战89-基于改造后的长短期记忆网络LSTM 的猪肉价格预测模型研究

weixin_42878111的博客

09-13

415

大家好，我是微学AI，今天给大家介绍一下深度学习实战89-基于改造后的长短期记忆网络LSTM 的猪肉价格预测模型研究。本文围绕基于改造后的长短期记忆网络 LSTM 的猪肉价格预测模型展开研究。首先介绍项目背景，阐述进行猪肉价格预测的重要性。接着详细讲解改造后的 LSTM 模型原理，为预测提供理论基础。

【梯度消失|梯度爆炸】Vanishing Gradient|Exploding Gradient——为什么我的卷积神经网络会不好呢？

最新发布

985小水博的摸鱼日常

09-15

865

【梯度消失|梯度爆炸】学习笔记

深度学习和机器学习的区别

weixin_45710581的博客

09-12

1200

机器学习（Machine Learning, ML）是人工智能的一个分支，它专注于让计算机通过观察和分析大量数据，自动发现规律和模式，并据此进行预测或决策。机器学习起源于20世纪50年代，当时的研究主要集中在简单的算法上，如决策树、逻辑回归等。随着技术的不断发展，机器学习逐渐形成了包括线性回归、支持向量机（SVM）、随机森林等多种算法在内的庞大体系。深度学习。

深度学习速通系列:one-hot编码

Ven%的博客

09-14

509

One-Hot编码是机器学习中处理分类特征的重要技术，它通过将分类变量转换为二进制向量，使得机器学习算法能够有效地处理这些变量。然而，使用时需要权衡其对特征维度、稀疏性、信息表示和模型选择的影响。在实际应用中，应根据数据的特点和模型的需求选择合适的编码策略。

使用注意力机制可以让你的模型更加灵活，但是需要额外的计算资源。rnn lstm bilstm attension

09-14

687

在这个例子中，我们定义了一个简单的注意力模块，并使用它来计算注意力权重，然后利用这些权重对双向LSTM的输出进行加权求和，得到一个上下文向量。# 输出形状应该是 (batch, 2 * hidden_size)，如果需要进一步处理可以再使用线性层。1. **计算注意力分数**：根据输入的查询（query）和键（key）计算注意力分数。2. **应用softmax**：对注意力分数应用softmax函数，使其成为概率分布。3. **加权求和**：使用注意力权重对值（value）进行加权求和，得到上下文向量。

深度学习速通系列:除了One-Hot编码，还有哪些其他处理分类数据的方法？

Ven%的博客

09-14

583

选择哪种编码方法取决于数据的特点、模型的类型以及特定的业务问题。在实际应用中，可能需要尝试多种方法，并通过模型性能来评估它们的有效性。