目标检测模型发展史

对于目标检测,传统的是基于滑动窗+分类模型;

而基于深度学习的有如下分类:

基于候选区域的,如R-CNN,SPP-net,Fast R-CNN,Faster R-CNN,R-FCN
端到端(End-to-End),如YOLO,SSD
2014 R-CNN,SPP-Net

2015 Fast R-CNN

2016 Faster R-CNN,R-FCN,YOLO,SSD

YOLO目前有4个版本, YOLOV1,YOLOV2(2017年),YOLO9000(2017年),YOLOV3(2018年)

YOLO:基于Google-Net

SSD:基于VGG
在这里插入图片描述
在这里插入图片描述

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Swin Transformer是一种基于Transformer架构的图像分类模型,它于2021年由***中文大学的研究团队提出。Swin Transformer的全称是"Swin Transformer: Hierarchical Vision Transformer using Shifted Windows",它在图像分类任务上取得了很好的性能。 在过去的几年中,Transformer模型在自然语言处理领域取得了巨大成功,但在图像领域的应用相对较少。传统的卷积神经网络(CNN)在图像分类任务上表现出色,但其局限性也逐渐显现出来。因此,研究人员开始探索将Transformer模型应用于图像领域。 Swin Transformer的提出主要解决了传统Transformer在处理大尺寸图像时的效率问题。传统的Transformer模型需要将整个图像划分为小的图块进行处理,这样会导致计算和内存开销较大。而Swin Transformer通过引入"shifted window"机制,将图像划分为不重叠的窗口,并在窗口内使用Transformer进行特征提取。这种窗口划分方式减少了计算和内存开销,并且通过层级结构的设计,实现了对不同尺度特征的建模。 Swin Transformer的发展史可以总结如下: 1. 2021年6月,***中文大学的研究团队提出了Swin Transformer的论文,详细介绍了其架构和设计原理。 2. Swin Transformer在多个图像分类任务上进行了实验,包括ImageNet数据集,取得了与当前最先进模型相媲美甚至超越的性能。 3. Swin Transformer的成功引起了广泛的关注和应用,许多研究团队和工业界开始将其应用于不同的计算机视觉任务,如目标检测、语义分割等。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值