1 PyCTD介绍
CTD数据库(Comparative Toxicogenomics Database)整合大量化学物质、基因、功能表型和疾病之间相互作用数据,为疾病相关环境暴露因素及药物潜在作用机制研究提供极大便利,自于2004年发布以来一直是广受好评。该数据库目前更新至2021年版本,总计超过4664万上述相互作用数据,包括超过230万种化学物质、46689个基因、4340个表型和7212种疾病信息。
PyCTD包是由弗劳恩霍夫算法和科学计算研究所生物信息学系(SCAI)开发,为从CTD查询数据提供了自动化的处理方式,不仅能够自动化的查询而且还能够连接MariaDB 或者是MySQL 实现数据的永久存储。
2 PyCTD的安装
安装方法跟安装其它的第三方Python依赖包一样,命令如下:
pip install pyctd
但是需要注意的是,由于pyctd开发的时间是2017年而且到现在一直没有更新版本,而CTD数据库是不断更新的,使用过程中对遇到很多问题。pyctd适配的python版本也要注意是python3.5系列。
3 PyCTD使用文档
4 CTD数据库实用方法
由于现在Pyctd数据库没有办法正常的使用,所以我们可以采用Pyctd包的思路去设计自己的脚本。Pyctd大致的思路就是从CTD数据库下载所有的相关数据,根据他们团队自己设置的数据表的依赖将数据分类存储。我们自己用的话不需要特别的设计依赖表,就直接从数据库下载之后存到MySQL数据库中,之后用python脚本连接数据库自己查询就好。