Graph R-CNN 使用指南

孔振冶Harry

于 2024-08-28 08:40:29 发布

阅读量376

点赞数 3

本文链接：https://blog.csdn.net/gitblog_01173/article/details/141623769

版权

欢迎来到 Graph R-CNN 的实践教程！本指南旨在帮助您快速了解并运行这个基于PyTorch实现的场景图生成项目。Graph R-CNN 是用于场景图生成的一种创新方法，首次发表于 ECCV 2018。本指南将分为三个主要部分：项目目录结构、启动文件简介以及配置文件解析。

本项目遵循了清晰的目录组织原则，便于开发者理解和定制：

main.py 是执行核心操作的脚本，支持多种模式：

训练: 使用 python main.py --config-file <配置文件路径> [--algorithm <算法名>] 来训练模型。对于多GPU环境，利用 python -m torch.distributed.launch --nproc_per_node=<可用GPU数> main.py ...。
评估与推理: 添加 --inference 参数，并指定模型检查点（--resume <checkpoint>）来评估模型性能。可以通过 --inference $YOUR_NUMBER 限制评估的图片数量。
可视化: 若要可视化结果，添加 --visualize 参数。

配置文件位于 configs 目录下，它们是.yaml格式，如 faster_rcnn_res101.yaml 和 sgg_res101_{joint/step}.yaml。这些文件详细规定了模型架构、优化器设置、学习率策略、数据集路径、预训练权重等关键信息。

基本训练配置: 如网络结构（ResNet-101作为骨干）、批次大小、学习率等。
联合与分步训练: 通过修改 --algorithm 参数选择不同的训练方式，joint 表示检测器与场景图生成同时进行，step 先单独训练检测器。
评估配置: 指定评估时使用的检查点和是否仅对部分图像进行评价。
个性化需求: 可以调整频率先验(--use_freq_prior)等特定选项，以适应不同场景下的需求。