DrugBank数据库以及其他介绍

        以后要研究的是人工智能与生物信息的结合,最近在看一篇论文的时候,用到了生物数据库Drug Bank,目前对Drug Bank了解还比较少,看了一下官网,做一下简单介绍。DrugBank数据库是一个综合的数据库,里面对于药物的介绍很详细,但对于交叉,以后应该主要用到的是数据集的下载。下文中如有表述不当的,欢迎指出。

一、搜索

       主页的搜索包括四种,分别为“Drugs(药品名)”、“Targets(靶点)”、“Pathways(作用途径)”、“Indications(适应症)”。

        我们搜索一个药物吗啡Morphine。打开后界面如图所示,在这里我们可以获得药物的基本信息,下面简单介绍一下前三种所展示的药物的详细内容。

1、IDENTIFICATION(识别)

包括如下图所示的内容,我们可以了解

Summary(综述,对药品的简单概括),

Brand Names(品牌),

Generic Name(通用名),DrugBank Accession Number(在这里我理解为编号),

Background(背景介绍),

Type(下图所示的是小分子),  Groups(组别,下图所示的是批准可临床实验的)

Structure(结构),

Chemical Formula(化学分子式)

2、PHARMACOLOGY(药理学)

这一部分包括有药效学、作用机理、吸收性、分布量、蛋白质结合、代谢、消除途径、半衰期、清除率、毒性、通路、药物基因组效应等。

 3、INTERACTIONS(相互作用)

和其他药物的相互作用,以及产生的后果等详细介绍。

二、Browse(浏览)

分为小分子药物、生物技术药物。

右侧是筛选项,包括是否批准(Approved),保健品(Nutraceutical),违禁药(Illicit),研究药物(Investigational),撤回药物(Withdrawm),实验药物(experimental)。


选择小分子药物,如下图显示所包括的小分子。

截止到2022年5月,有2727个经过批准的小分子药物。

 截止到2022年5月,有1399个经过批准的生物技术药物。

 三、Download(下载)

所有的数据集都是可以下载的,但是下载需要申请,填写一个基本的下载申请问卷。

不同内容下载格式不同:完整版是xml,结构体是SDF,外部链接是CSV,蛋白质标识符是CSV,目标序列是FASTA。

1、COMPLETE DATABASE(完整数据集)

      完整数据集下载的是xml格式。

2、STRUCTURES(结构体)

结构体数据集下载的是SDF格式,页面往下化也有外部链接,是对应的CSV格式。

​ 

 3、EXTERNAL LINKS(外部药物链接)

下面还含有:

Target Drug-UniProt Links(靶标Drug-UniProt链接)

Enzyme Drug-UniProt Links(酶Drug-UniProt链接)

Carrier Drug-UniProt Links(载体Drug-UniProt链接)

Transporter Drug-UniProt Links(运输机Drug-UniProt链接)

 4、PROTEIN IDENTIFIERS(蛋白质标识符)

下载的数据集是CSV格式

蛋白质标识符包括外部资源的id,如UniProt和PDB。这些下载首先按蛋白质/化合物类型(目标,转运体等)进行划分。其次,它们按药物类别划分(合法、非法等)。每个档案包含2个文件:一个针对所有靶标/酶/转运体/载体,另一个仅针对标记为药理活性(与至少一种相关药物的作用机制直接相关)的文件。导出CSV文件中的每一行还包括一个连接的DrugBank药品id列表(以分号分隔)作为最后一列。

所包括的是:

Drug Target Identifiers(药物靶标标识符)

Drug Enzyme Identifiers(药物酶标识符)

Drug Carrier Identifiers(药物载体标识符)

Drug Transporter Identifiers(药物转运体标识符)

5、TARGET SEQUENCES(目标序列)

下载的数据集是FASTA格式

所包括的是:

Drug Target Sequences(药物靶标序列)

Drug Enzyme Sequences(药物酶序列)

Drug Carrier Sequences(药物载体序列)

Drug Transporter Sequences(药物转运体序列)

四、Drug Bank数据处理

我对于数据预处理部分还是有很多不懂的地方,因此参考了很多链接。

1、XML的文件解析,输出的是CSV格式的数据,文章内有代码。

       https://zhuanlan.zhihu.com/p/347900976

2、XML的文件解析,采用的是先转换为json格式,处理json文件,提取信息存成CSV格式。

       https://zhuanlan.zhihu.com/p/456252080

  • 6
    点赞
  • 43
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
DrugBank是一个广泛使用的药物数据库,提供了关于药物的详细信息和相应的科学数据。在使用DrugBank之前,我们需要下载它并安装在我们的计算机上。 首先,我们需要在DrugBank的官方网站上找到下载页面。通常,下载页面会提供不同的选项和链接,以适应不同的操作系统和需求。我们可以根据自己的操作系统(如Windows、Mac或Linux)选择适合我们的版本。 在选择了适合的版本后,我们可以点击下载链接,将DrugBank的安装文件保存到我们的计算机上。下载过程可能需要一些时间,具体取决于我们的网络连接速度和文件大小。 一旦下载完成,我们可以通过点击安装文件来开始安装过程。接下来,我们将按照安装程序的指示进行操作。这可能包括接受许可协议、选择安装位置和完成其他必要的设置。 在安装完成后,我们可以从我们的计算机上启动DrugBank。通常,DrugBank会提供一个用户界面,允许我们浏览和搜索药物信息。我们可以使用相应的功能和搜索栏来查找特定的药物,并获得有关药物的详细信息、化学结构、药理学特性等。 总的来说,DrugBank的下载过程相对简单。我们只需访问官方网站,选择适合我们操作系统的版本,下载安装文件并按照安装程序的指示进行操作。安装完成后,我们就可以开始使用DrugBank提供的丰富药物信息了。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值