PyCTD | Python连接CTD数据库查询、下载和处理数据

1 PyCTD介绍

  CTD数据库(Comparative Toxicogenomics Database)整合大量化学物质、基因、功能表型和疾病之间相互作用数据,为疾病相关环境暴露因素及药物潜在作用机制研究提供极大便利,自于2004年发布以来一直是广受好评。该数据库目前更新至2021年版本,总计超过4664万上述相互作用数据,包括超过230万种化学物质、46689个基因、4340个表型和7212种疾病信息。
  PyCTD包是由弗劳恩霍夫算法和科学计算研究所生物信息学系(SCAI)开发,为从CTD查询数据提供了自动化的处理方式,不仅能够自动化的查询而且还能够连接MariaDB 或者是MySQL 实现数据的永久存储。

2 PyCTD的安装

  安装方法跟安装其它的第三方Python依赖包一样,命令如下:

pip install pyctd

但是需要注意的是,由于pyctd开发的时间是2017年而且到现在一直没有更新版本,而CTD数据库是不断更新的,使用过程中对遇到很多问题。pyctd适配的python版本也要注意是python3.5系列。

3 PyCTD使用文档

  使用文档

4 CTD数据库实用方法

  由于现在Pyctd数据库没有办法正常的使用,所以我们可以采用Pyctd包的思路去设计自己的脚本。Pyctd大致的思路就是从CTD数据库下载所有的相关数据,根据他们团队自己设置的数据表的依赖将数据分类存储。我们自己用的话不需要特别的设计依赖表,就直接从数据库下载之后存到MySQL数据库中,之后用python脚本连接数据库自己查询就好。

5 参考文献

[1]Github文档

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值