上期我们分享了望楼团队在【亚马逊云科技 AI For Good-2022 遥感光学影像目标检测挑战赛】中采用的算法策略与开发体验。
本次赛事聚焦遥感光学目标检测,存在图像尺寸大、目标角度各异等诸多难点,挑战难度高。其中,来自浙江大学的金润杰率领的 OC 团队斩获第2名。我们对 OC 团队进行了采访,邀请他们分享参赛体验与算法策略。
Q1
本次比赛的图像数据尺寸较大、数据量较多,请问贵团队采用了什么方法解决这些数据处理的挑战?
我们的解决思路是 RoI Transformer + Swin-Transformer + Recursive Feature Pyramid + 模型融合;切图训练,单张图片大小1024*1024,gap=200,在线数据增强使用随机翻转和随机旋转。
A
Q2
针对遥感图像识别,贵团队构建算法模型的基本思路是什么?
RoI Transformer 用于二阶检测器中。它由两部分组成:第一部分是 RRoI Learner,它学习从 HRoIs 到 RRoIs 的转换;第二部分是 RRoI Warping,它从 RRoI 中提取旋转不变的特征,用于后续的分类和回归子任务。
为了进一步提高效率,模型原作者为所有的 RoI-wise operations 采用了 light head structure。roi-wise operation 一直是二阶检测器的效率瓶颈,因为它们之间的计算不共享。
Light-head R-CNN 提出使用分离卷积来获得 thin feature 以解决这个问题,它还使用 PS RoI pooling 来进一步削减特征图的通道数,本文方法的 baseline 就是 Light-head R-CNN。
核心算法设计
A
Q3
本次比赛是基于 Amazon Sagemaker 进行的模型搭建,贵团队在使用 Amazon Sagemaker 的过程中有哪些感受和经验?
Sagemaker系统资源丰富,无需任何投入即可马上开始使用 Amazon SageMaker。每月可获得 250 个小时的 t2.medium 记事本实例使用额度,50 个小时的 m4.xlarge 训练用实例使用额度,外加 125 个小时的 m4.xlarge 托管用实例使用额度。不仅提供了不同层次、不同性能的加速计算服务器,而且配置了多种框架和镜像,训练省时省力。
在实际部署的时候,我们在控制面板中创建笔记本实例进行训练。笔记本成功创建的界面如下:
随后在创建 notebook 进行训练,如下所示:
A
Q4
贵团队在本次大赛中获得了第二名的优秀成绩,回顾本场比赛,你们有什么心得和体验?
我们以 RoI Transformer + Swin-Transformer + Recursive Feature Pyramid + 模型融合为解决思路,较好地平衡了计算速度和计算精度,实现了算法效率的提升,我想这也是我们能够获得较好分数的核心原因。
同时 Amazon Sagemaker 为我们的模型训练提供了充足的计算资源和运行环境,对初次使用 Amazon Sagemaker 的我们来说十分友好,减少了代码编写和训练调优的阻碍。最后希望我们团队的算法思路能够帮助广大开发者朋友启发思路,也建议各位开发同学尝试使用 Amazon Sagemaker 搭建项目。
A
本次【亚马逊云科技 AI For Good-2022 遥感光学影像目标检测挑战赛】赛题难度大、挑战多,OC 团队以 RoI Transformer + Swin-Transformer + Recursive Feature Pyramid + 模型融合为解决思路,同时 Amazon Sagemaker 为其模型训练提供了充足的计算资源和运行环境。
阅读本文后,希望 OC 团队的算法策略能够给开发者们提供有益启示。
听说,点完下面4个按钮
就不会碰到bug了!