亚马逊云科技 AI For Good-2022优秀方案开源分享——OC

亚马逊云开发者

于 2022-11-03 18:05:44 发布

阅读量264

点赞数

原文链接：https://mp.weixin.qq.com/s?__biz=Mzg4NjU5NDUxNg==&mid=2247530452&idx=1&sn=7fa1d4f26ed1faf6fb4b8def07701ca4&chksm=cf95796ff8e2f0792387606e84cd69b02a2abcd2caf863c8ddeb5ccca467bcde17c069a5627d&scene=126&&sessionid=0

版权

上期我们分享了望楼团队在【亚马逊云科技 AI For Good-2022 遥感光学影像目标检测挑战赛】中采用的算法策略与开发体验。

本次赛事聚焦遥感光学目标检测，存在图像尺寸大、目标角度各异等诸多难点，挑战难度高。其中，来自浙江大学的金润杰率领的 OC 团队斩获第2名。我们对 OC 团队进行了采访，邀请他们分享参赛体验与算法策略。

本次比赛的图像数据尺寸较大、数据量较多，请问贵团队采用了什么方法解决这些数据处理的挑战？

我们的解决思路是 RoI Transformer + Swin-Transformer + Recursive Feature Pyramid + 模型融合；切图训练，单张图片大小1024*1024，gap=200，在线数据增强使用随机翻转和随机旋转。

针对遥感图像识别，贵团队构建算法模型的基本思路是什么？

RoI Transformer 用于二阶检测器中。它由两部分组成：第一部分是 RRoI Learner，它学习从 HRoIs 到 RRoIs 的转换；第二部分是 RRoI Warping，它从 RRoI 中提取旋转不变的特征，用于后续的分类和回归子任务。

为了进一步提高效率，模型原作者为所有的 RoI-wise operations 采用了 light head structure。roi-wise operation 一直是二阶检测器的效率瓶颈，因为它们之间的计算不共享。

Light-head R-CNN 提出使用分离卷积来获得 thin feature 以解决这个问题，它还使用 PS RoI pooling 来进一步削减特征图的通道数，本文方法的 baseline 就是 Light-head R-CNN。

核心算法设计

本次比赛是基于 Amazon Sagemaker 进行的模型搭建，贵团队在使用 Amazon Sagemaker 的过程中有哪些感受和经验？

Sagemaker系统资源丰富，无需任何投入即可马上开始使用 Amazon SageMaker。每月可获得 250 个小时的 t2.medium 记事本实例使用额度，50 个小时的 m4.xlarge 训练用实例使用额度，外加 125 个小时的 m4.xlarge 托管用实例使用额度。不仅提供了不同层次、不同性能的加速计算服务器，而且配置了多种框架和镜像，训练省时省力。

在实际部署的时候，我们在控制面板中创建笔记本实例进行训练。笔记本成功创建的界面如下：

随后在创建 notebook 进行训练，如下所示：

贵团队在本次大赛中获得了第二名的优秀成绩，回顾本场比赛，你们有什么心得和体验？

我们以 RoI Transformer + Swin-Transformer + Recursive Feature Pyramid + 模型融合为解决思路，较好地平衡了计算速度和计算精度，实现了算法效率的提升，我想这也是我们能够获得较好分数的核心原因。

同时 Amazon Sagemaker 为我们的模型训练提供了充足的计算资源和运行环境，对初次使用 Amazon Sagemaker 的我们来说十分友好，减少了代码编写和训练调优的阻碍。最后希望我们团队的算法思路能够帮助广大开发者朋友启发思路，也建议各位开发同学尝试使用 Amazon Sagemaker 搭建项目。

本次【亚马逊云科技 AI For Good-2022 遥感光学影像目标检测挑战赛】赛题难度大、挑战多，OC 团队以 RoI Transformer + Swin-Transformer + Recursive Feature Pyramid + 模型融合为解决思路，同时 Amazon Sagemaker 为其模型训练提供了充足的计算资源和运行环境。

阅读本文后，希望 OC 团队的算法策略能够给开发者们提供有益启示。