GraphMVP: 基于3D几何的分子图表示预训练教程
GraphMVP 项目地址: https://gitcode.com/gh_mirrors/gr/GraphMVP
1. 项目目录结构及介绍
GraphMVP/
├── datasets # 数据集相关文件夹,存放分子数据或处理后的数据。
├── fig # 可能包含项目相关的图表或示意图。
├── legacy # 过时代码或旧版本保留区域,分为分类(src_classification)和回归(src_regression)两个子文件夹。
├── scripts_classification # 分类任务的脚本,包括预训练和微调。
│ ├── submit_pre_training_GraphMVP.sh # GraphMVP预训练脚本
│ ├── submit_pre_training_GraphMVP_hybrid.sh # GraphMVP混合模型预训练脚本
│ └── submit_fine_tuning.sh # 预训练后针对具体分类任务的微调脚本
├── scripts_regression # 回归任务的对应脚本
│ ├── submit_pre_training_GraphMVP.sh # 同上,但针对回归任务
│ ├── submit_pre_training_GraphMVP_hybrid.sh
│ └── submit_fine_tuning.sh
├── src_classification # 分类任务的源代码
├── src_regression # 回归任务的源代码
├── LICENSE # 开源许可证文件
└── README.md # 项目的主要说明文档,包括快速入门和重要说明。
项目以清晰的模块化方式组织,便于开发者理解和接入。scripts
文件夹中包含了用于实验的不同阶段(如预训练、微调)的shell脚本,而src
文件夹则存储了实现模型的核心代码。
2. 项目的启动文件介绍
预训练启动
对于GraphMVP的预训练,主要通过以下两个Shell脚本来进行:
scripts_classification/submit_pre_training_GraphMVP.sh
: 启动原始GraphMVP模型的预训练过程。scripts_classification/submit_pre_training_GraphMVP_hybrid.sh
: 启动GraphMVP的混合模型(包含额外的自监督学习前体任务)的预训练。
这两个脚本通常需要预先配置好环境,并且可能需要设置一些必要的环境变量或参数来指定数据集路径、日志记录等。
微调启动
完成预训练后,可通过相应的微调脚本来适应特定的任务,例如:
scripts_classification/submit_fine_tuning.sh
: 使用预训练模型对分类任务进行微调。- 类似地,对于回归任务也有对应的脚本。
3. 项目的配置文件介绍
虽然直接的配置文件在上述描述中未明确指出,配置通常是通过命令行参数或脚本内的变量设定来完成的。这意味着用户需要通过修改脚本中的参数或者直接在运行脚本时提供参数来配置预训练和微调的过程。这包括但不限于模型参数、优化器设置、批次大小、数据路径等关键信息。由于具体的配置细节并未单独作为一个.config
或.yaml
文件存在,因此开发者需仔细阅读每个脚本中的注释和默认参数设置,以便正确配置实验。
为了深入定制化,理解项目核心代码中的超参数定义也是很重要的。在实际操作前,建议先查阅README.md
文档获取初始化配置指导和环境搭建步骤。在复杂情况下,直接修改源码中的配置或增加参数解析逻辑是常见的做法。