摘要
PP-HGNet(High Performance GPU Net) 是百度飞桨视觉团队自研的更适用于 GPU 平台的高性能骨干网络,该网络在 VOVNet 的基础上使用了可学习的下采样层(LDS Layer),融合了 ResNet_vd、PPHGNet 等模型的优点,该模型在 GPU 平台上与其他 SOTA 模型在相同的速度下有着更高的精度。在同等速度下,该模型高于 ResNet34-D 模型 3.8 个百分点,高于 ResNet50-D 模型 2.4 个百分点,在使用百度自研 SSLD 蒸馏策略后,超越 ResNet50-D 模型 4.7 个百分点。与此同时,在相同精度下,其推理速度也远超主流 VisionTransformer 的推理速度。PP-HGNet 使用 3x3 标准卷积(计算密度最高)较多。在此将 VOVNet 作为基准模型,将主要的有利于 GPU 推理的改进点进行融合。PP-HGNet 骨干网络的整体结构如下:
其中,PP-HGNet是由多个HG-Block组成,HG-Block的结构如下:
代码可在这个链接找到:代码地址
本文在YOLOv8中的主干网络替换成PP-HGNetV1,代码已经整理好了,跟着文章复制粘贴,即可直接运行