图像目标检测的基本框架算法

qq_34429849

已于 2024-08-25 01:10:09 修改

阅读量90

点赞数 1

文章标签：目标检测算法人工智能

于 2024-08-24 20:45:59 首次发布

本文链接：https://blog.csdn.net/qq_34429849/article/details/141503945

版权

https://github.com/open-mmlab/mmdetection/tree/main?tab=readme-ov-file
一阶段和二阶段区别;
一阶段：一个单独的网络模型，能够同时进行物体位置估计和类别分类。
二阶段：第一阶段获得候选区域了，得到一个候选区域的特征图，然后第二阶段利用这个候选区域内的特征图特征分为两个head，一个全连接预测类别，一个预测偏移量
https://blog.csdn.net/weixin_48331187/article/details/133921056

一阶段ssd算法：
根据不同的特征层设置不同大小的先验框，在不同的特征层上建立检测头和分类头，以满足大、小目标检测的需求

pytorch实现：
代码点击即可

https://blog.csdn.net/qq_52191127/article/details/141110932
二阶段的图像检测的几个代表作：

spp:
改进了rcnn, 和全卷积一样，控制了输出的维度不受尺寸的影响。同时也只提取整个图片一次特征，建立特征图的映射关系，直接在特征图上找到对应提取的感兴趣区域，不像之前每个感兴趣区域单独提取一次特征。
https://zhuanlan.zhihu.com/p/655853267
https://zhuanlan.zhihu.com/p/656096456
fast rcnn:
把spp里面的最后的池化只保留最多的池化，roi池化，加快速度，全连接的时候，采用了svd分解方法，加快计算，同时一起训练box的回归，这样这里引入两个loss，后边分类就没用svm了
https://blog.csdn.net/m0_51700479/article/details/135678498

faster-rcnn: 因为上边fast-rcnn的瓶颈在ss选取感兴趣区域上，耗时太多，那么这里首次提出RPN部分，基于锚点完成候选区域的处理，实现了端到端的目标检测模型。
https://zhuanlan.zhihu.com/p/31426458

mask-rcnn:
这个为了实现大小目标的检测，因为深度的特征语义信息比较足，但是空间位置信息少了，浅层空间位置保留的多，但是又不好处理语义信息，大物体信息，就是深层网络容易响应语义特征，浅层网络容易响应图像特征，
这里提出来一个FPN网络,融合各个尺度信息，金字塔方法，网络结果和unet很像，这里用的邻近插值，unet双线性插值，这里是农村维度一样，直接想加，unet是直接拼接，可参这个（https://zhuanlan.zhihu.com/p/79204199）
这个整体流程：https://www.cnblogs.com/wangyong/p/10614898.html
https://blog.csdn.net/qq_51605551/article/details/140251788
https://blog.csdn.net/weixin_43702653/article/details/124377487

qq_34429849

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
图像目标检测的基本框架算法

同时也只提取整个图片一次特征，建立特征图的映射关系，直接在特征图上找到对应提取的感兴趣区域，不像之前每个感兴趣区域单独提取一次特征。把spp里面的最后的池化只保留最多的池化，roi池化，加快速度，全连接的时候，采用了svd分解方法，加快计算，同时一起训练box的回归，这样这里引入两个loss，后边分类就没用svm了。二阶段：第一阶段获得候选区域了，得到一个候选区域的特征图，然后第二阶段利用这个候选区域内的特征图特征分为两个head，一个全连接预测类别，一个预测偏移量。一阶段和二阶段区别;
复制链接

扫一扫