PyCTD 开源项目教程

PyCTD 开源项目教程

pyctd PyCTD is a Python software package to query and analyse data from the CTD database pyctd 项目地址: https://gitcode.com/gh_mirrors/py/pyctd

1. 项目介绍

PyCTD 是一个由 Fraunhofer Institute for Algorithms and Scientific Computing (SCAI) 的生物信息学部门开发的 Python 软件包。它旨在通过编程方式访问和分析 Comparative Toxicogenomics Database (CTD) 提供的数据。CTD 数据库包含了化学物质与基因/蛋白质相互作用、化学物质与疾病以及基因与疾病之间的关系数据。

PyCTD 的主要目标是提供对本地存储的 CTD 数据的编程访问,并允许以科学界常用的多种格式进行过滤导出。此外,PyCTD 还专注于生物疾病知识网络的分析和扩展。

2. 项目快速启动

安装

PyCTD 可以通过 pip 进行安装:

pip install pyctd

如果你没有权限在系统上安装软件,可以使用 --user 选项:

pip install --user pyctd

如果你使用的是 Python 3,可以使用以下命令:

python3 -m pip install pyctd

数据库设置

使用 SQLite

如果你没有权限使用 MySQL 或 MariaDB,可以选择使用 SQLite。SQLite 不需要额外的安装,适合快速测试。

使用 MySQL/MariaDB

首先,以 root 用户登录 MySQL 并创建一个新的数据库和用户:

CREATE DATABASE pyctd CHARACTER SET utf8 COLLATE utf8_general_ci;
GRANT ALL PRIVILEGES ON pyctd.* TO 'pyctd_user'@'%' IDENTIFIED BY 'pyctd_passwd';
FLUSH PRIVILEGES;

然后,在 Python 中设置 MySQL 连接:

import pyctd
pyctd.set_mysql_connection(host='localhost', user='pyctd_user', passwd='pyctd_passwd', db='pyctd')

更新数据

更新过程将下载 CTD 团队提供的文件。请注意,下载文件需要大约 1.5GB 的磁盘空间,更新过程可能需要约 2 小时(取决于系统性能):

import pyctd
pyctd.update()

示例查询

以下是一个简单的查询示例,获取与特定基因和交互动作相关的化学物质信息:

import pyctd

query = pyctd.query()
results = query.get_chem_gene_interaction_actions(gene_name='APP', interaction_action='meman%', limit=1)

first_result = results[0]
print(first_result.chemical)  # 输出: Memantine
print(first_result.pubmed_ids)  # 输出: [21290839]
print(first_result.chemical_drugbank_ids)  # 输出: [DB014043]

3. 应用案例和最佳实践

应用案例

PyCTD 在 IMI(INNOVATIVE MEDICINES INITIATIVE)项目 AETIONOMY 和 PHAGO 中得到了应用。这些项目旨在通过创建和分析复杂的生物 BEL 网络,识别阿尔茨海默病和帕金森病的机制,以支持药物开发。

最佳实践

  1. 数据更新:定期更新 CTD 数据以确保分析的准确性和时效性。
  2. 数据库选择:根据需求选择合适的数据库系统。对于高性能需求,推荐使用 MySQL 或 MariaDB。
  3. 查询优化:使用 SQLAlchemy 提供的查询优化功能,提高查询效率。

4. 典型生态项目

PyBEL

PyBEL 是一个用于处理生物网络数据的 Python 库,与 PyCTD 结合使用可以更方便地分析和扩展生物疾病知识网络。

SQLAlchemy

SQLAlchemy 是一个强大的 Python SQL 工具包,PyCTD 使用它来支持多种关系数据库管理系统(RDBMS),如 MySQL、MariaDB、SQLite 等。

通过这些生态项目的结合,PyCTD 可以更好地服务于生物信息学研究和药物开发领域。

pyctd PyCTD is a Python software package to query and analyse data from the CTD database pyctd 项目地址: https://gitcode.com/gh_mirrors/py/pyctd

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

卓桔洋

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值