PLINDER项目安装与配置指南
1. 项目基础介绍
PLINDER(Protein-Ligand INteractions Dataset and Evaluation Resource)是一个开源项目,旨在为蛋白质-配体对接算法的训练和评估提供全面、注释详尽的高质量数据集和资源。该数据集包含了超过11k个SCOP域和50k个独特小分子的400k个PLI系统,每个系统有750个以上的注释,包括蛋白质和配体属性、质量、匹配分子系列等。
PLINDER项目是一个社区协作项目,由巴塞尔大学、SIB瑞士生物信息学研究所、VantAI、NVIDIA、MIT CSAIL等机构共同发起,并将定期更新。
主要编程语言
PLINDER项目主要使用Python编程语言。
2. 项目使用的关键技术和框架
- 数据管理:使用Python进行数据管理和处理。
- 数据存储:数据集存储在Google Cloud Storage(GCS) bucket中。
- 数据接口:提供Python包
plinder
,方便用户通过Python代码访问和操作数据。 - 评估框架:内置了评估框架,用于简化模型性能的比较。
3. 项目安装和配置的准备工作
在开始安装PLINDER之前,请确保您的系统已经安装了以下依赖:
- Python 3.6 或更高版本
gsutil
工具,用于从Google Cloud Storage bucket下载数据
安装步骤
-
设置环境变量: 首先,您需要设置环境变量,指定PLINDER的版本和迭代。
export PLINDER_RELEASE=2024-06 # 当前版本 export PLINDER_ITERATION=v2 # 当前迭代
-
创建数据存储目录: 接下来,创建一个目录来存储PLINDER数据集。
mkdir -p ~/.local/share/plinder/${PLINDER_RELEASE}/${PLINDER_ITERATION}/
-
下载数据集: 使用
gsutil
工具从GCS bucket下载数据集。gsutil -m cp -r "gs://plinder/${PLINDER_RELEASE}/${PLINDER_ITERATION}/*" ~/.local/share/plinder/${PLINDER_RELEASE}/${PLINDER_ITERATION}/
-
安装Python包: 最后,使用pip安装PLINDER Python包。
pip install plinder
完成以上步骤后,您就可以开始使用PLINDER数据集和Python包进行开发了。更多详细信息和用法,请参考项目的官方文档。
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考