PLINDER项目安装与配置指南

洪赫逊

于 2025-04-14 16:11:43 发布

阅读量796

点赞数 22

本文链接：https://blog.csdn.net/gitblog_00613/article/details/147226148

版权

PLINDER项目安装与配置指南

plinder Protein Ligand INteraction Dataset and Evaluation Resource 项目地址: https://gitcode.com/gh_mirrors/pl/plinder

1. 项目基础介绍

PLINDER（Protein-Ligand INteractions Dataset and Evaluation Resource）是一个开源项目，旨在为蛋白质-配体对接算法的训练和评估提供全面、注释详尽的高质量数据集和资源。该数据集包含了超过11k个SCOP域和50k个独特小分子的400k个PLI系统，每个系统有750个以上的注释，包括蛋白质和配体属性、质量、匹配分子系列等。

PLINDER项目是一个社区协作项目，由巴塞尔大学、SIB瑞士生物信息学研究所、VantAI、NVIDIA、MIT CSAIL等机构共同发起，并将定期更新。

主要编程语言

PLINDER项目主要使用Python编程语言。

2. 项目使用的关键技术和框架

数据管理：使用Python进行数据管理和处理。
数据存储：数据集存储在Google Cloud Storage（GCS） bucket中。
数据接口：提供Python包plinder，方便用户通过Python代码访问和操作数据。
评估框架：内置了评估框架，用于简化模型性能的比较。

3. 项目安装和配置的准备工作

在开始安装PLINDER之前，请确保您的系统已经安装了以下依赖：

Python 3.6 或更高版本
gsutil工具，用于从Google Cloud Storage bucket下载数据

安装步骤

设置环境变量：首先，您需要设置环境变量，指定PLINDER的版本和迭代。
```
export PLINDER_RELEASE=2024-06  # 当前版本
export PLINDER_ITERATION=v2    # 当前迭代
```
创建数据存储目录：接下来，创建一个目录来存储PLINDER数据集。
```
mkdir -p ~/.local/share/plinder/${PLINDER_RELEASE}/${PLINDER_ITERATION}/
```

下载数据集：使用gsutil工具从GCS bucket下载数据集。

gsutil -m cp -r "gs://plinder/${PLINDER_RELEASE}/${PLINDER_ITERATION}/*" ~/.local/share/plinder/${PLINDER_RELEASE}/${PLINDER_ITERATION}/

安装Python包：最后，使用pip安装PLINDER Python包。
```
pip install plinder
```

完成以上步骤后，您就可以开始使用PLINDER数据集和Python包进行开发了。更多详细信息和用法，请参考项目的官方文档。

plinder Protein Ligand INteraction Dataset and Evaluation Resource 项目地址: https://gitcode.com/gh_mirrors/pl/plinder

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考