YOLOv8独家改进 PKIBlock多尺度卷积核(小目标必备)

1.PKINet原理介绍

论文: 2403.06258.pdf (arxiv.org)

摘要:遥感图像目标检测(RSIs)经常面临一些日益严峻的挑战,包括目标尺度的巨大变化和不同的测距环境。先前的方法试图通过大核卷积或扩展卷积来扩展主干的空间感受野来解决这些挑战。然而,前者通常会引入相当大的背景噪声,而后者可能会产生过于稀疏的特征表示。在本文中,我们引入聚核初始网络(Poly Kernel Inception Network ,PKINet)来解决上述挑战。PKINet采用无扩展的多尺度卷积核来提取不同尺度的目标特征并捕获局部上下文。此外,还并行引入了上下文锚定注意(CAA)模块来捕获远程上下文信息。这两个组件共同工作,以提高PKINet在四个具有挑战性的遥感检测基准上的性能,即DOTA-v1.0, DOTA-v1.5, HRSC2016和DIOR-R。

我们的方法在DOTA-v1.0[64]上使用更少的参数,在各种遥感探测器[10,20,59,65,71]上获得了稳定的性能提升。

下图:具有小核的网络在大目标检测中忽略了远程上下文,而具有大核的网络在小目标检测中

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
yolov8是一种目标检测算法,它是对yolo算法的改进和升级。在提出yolov8的过程中,有一项重要的改进策略是引入了多尺度卷积技术。 多尺度卷积是指在神经网络中使用不同尺度(大小)的卷积核来进行卷积操作。这种策略的目的是使网络能够更好地捕捉不同尺度下的目标信息。 在目标检测中,不同的目标往往具有不同的大小。传统的单一尺度卷积在处理目标时会存在一定的局限性,可能会导致对较小目标的检测效果不佳。而通过引入多尺度卷积,可以增加网络对不同尺度目标的敏感性,提升目标检测的准确性和召回率。 在yolov8中,多尺度卷积被应用在主干网络部分,如Darknet-53网络结构中的卷积层。通过在不同层级上使用不同尺度的卷积核yolov8可以同时捕捉到多个尺度下的目标信息。这样的设计使得yolov8在检测不同尺寸目标时具有更好的表现。 此外,yolov8还采用了其他一些改进策略,例如使用更深的网络结构、引入残差连接、使用自适应学习率等。这些改进都有助于提升yolov8目标检测任务中的性能和效果。 总的来说,yolov8通过引入多尺度卷积等改进策略,使得网络在处理目标检测任务时具有更好的适应性和精确性。它的改进不仅提升了目标检测的准确率,也为实际应用中更好地应对不同尺度目标提供了重要的技术支持。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值