图像目标检测的基本框架算法

https://github.com/open-mmlab/mmdetection/tree/main?tab=readme-ov-file
一阶段和二阶段区别;
一阶段:一个单独的网络模型,能够同时进行物体位置估计和类别分类。
二阶段:第一阶段获得候选区域了,得到一个候选区域的特征图,然后第二阶段利用这个候选区域内的特征图特征分为两个head,一个全连接预测类别,一个预测偏移量
https://blog.csdn.net/weixin_48331187/article/details/133921056

一阶段ssd算法:
根据不同的特征层设置不同大小的先验框,在不同的特征层上建立检测头和分类头,以满足大、小目标检测的需求

pytorch实现:
代码点击即可

https://blog.csdn.net/qq_52191127/article/details/141110932
二阶段的图像检测的几个代表作:

spp:
改进了rcnn, 和全卷积一样,控制了输出的维度不受尺寸的影响。同时也只提取整个图片一次特征,建立特征图的映射关系,直接在特征图上找到对应提取的感兴趣区域,不像之前每个感兴趣区域单独提取一次特征。
https://zhuanlan.zhihu.com/p/655853267
https://zhuanlan.zhihu.com/p/656096456
fast rcnn:
把spp里面的最后的池化只保留最多的池化,roi池化,加快速度,全连接的时候,采用了svd分解方法,加快计算,同时一起训练box的回归,这样这里引入两个loss,后边分类就没用svm了
https://blog.csdn.net/m0_51700479/article/details/135678498

faster-rcnn: 因为上边fast-rcnn的瓶颈在ss选取感兴趣区域上,耗时太多,那么这里首次提出RPN部分,基于锚点完成候选区域的处理,实现了端到端的目标检测模型。
https://zhuanlan.zhihu.com/p/31426458

mask-rcnn:
这个为了实现大小目标的检测,因为深度的特征语义信息比较足,但是空间位置信息少了,浅层空间位置保留的多,但是又不好处理语义信息,大物体信息,就是深层网络容易响应语义特征,浅层网络容易响应图像特征,
这里提出来一个FPN网络,融合各个尺度信息,金字塔方法,网络结果和unet很像,这里用的邻近插值,unet双线性插值,这里是农村维度一样,直接想加,unet是直接拼接,可参这个(https://zhuanlan.zhihu.com/p/79204199)
这个整体流程:https://www.cnblogs.com/wangyong/p/10614898.html
https://blog.csdn.net/qq_51605551/article/details/140251788
https://blog.csdn.net/weixin_43702653/article/details/124377487

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值