深度学习-目标检测学习笔记

Jiqiang_z

已于 2023-11-18 14:56:58 修改

阅读量184

点赞数

文章标签：目标检测学习笔记

于 2023-11-16 11:13:00 首次发布

本文链接：https://blog.csdn.net/jjjqqq123321/article/details/134437560

版权

一：基础知识

1.目标检测常见指标

2.目标检测前言

3.知识补充

什么是非极大值抑制剔除重叠建议框？

什么是Rol（Region of Interest）感兴趣区域？

在目标检测中，感兴趣区域（Region of Interest，RoI）是指在整个图像中被认为可能包含目标的区域。为了提高检测效率，很多目标检测方法采用了两阶段的策略。第一阶段通常是生成一组候选框（通常称为候选区域或建议区域），第二阶段则对这些候选框进行分类和精细调整，以确定最终的目标框。

一些常见的区域提议方法包括：

选择性搜索（Selective Search）： 通过在图像中的不同尺度和颜色空间上运行启发式搜索算法，选择性搜索生成一组可能的候选区域。
EdgeBoxes： EdgeBoxes是一种基于图像边缘信息的区域提议方法，它考虑到目标通常在图像中有明显的边缘。
RPN（Region Proposal Network）： RPN是一种基于深度学习的区域提议网络，可以端到端地学习生成候选区域。

这些方法生成的候选区域通常被称为感兴趣区域（RoI），它们在目标检测任务中起到了筛选出可能包含目标的区域的作用。在后续的处理中，这些感兴趣区域将被用来提取特征并进行目标分类和边界框回归。

什么是BN（Batch Normalization）？

神经网络中BN层的原理与作用_神经网络bn-CSDN博客

BN层的基本思想其实相当直观：因为深层神经网络在做非线性变换前的输入值（就是那个y=Wx+B，x是输入）随着网络深度加深或者在训练过程中，其分布逐渐发生偏移或者变动，之所以训练收敛慢，一般是整体分布逐渐往非线性函数的取值区间的上下限两端靠近，所以这导致反向传播时低层神经网络的梯度消失，这是训练深层神经网络收敛越来越慢的本质原因，而BN就是通过一定的规范化手段，把每层神经网络任意神经元这个输入值的分布强行拉回到均值为0方差为1的标准正态分布，其实就是把越来越偏的分布强制拉回比较标准的分布，这样使得激活输入值落在非线性函数对输入比较敏感的区域，网络的输出就不会很大，可以得到比较大的梯度，避免梯度消失问题产生，而且梯度变大意味着学习收敛速度快，能大大加快训练速度。