最近在阅读Improving drug–drug interactions prediction with interpretability via meta-path-based information fusion看数据集,记录一些不懂的地方。
关于DrugBank:
DrugBank 数据库是一个综合性的生物信息学和化学信息学资源,它提供了详细的药物数据和全面的药物目标信息。它包含的数据类型非常广泛,包括但不限于:
- 化学结构:药物的化学结构信息。
- 小分子药物和生物技术药物:包括已获批准的药物、保健食品、实验性药物等。
- 药物靶标和转运蛋白:药物作用的靶点名称、分类、结构和相关的生物途径等。
- 药物靶标序列和SNP:药物靶标的序列信息。
- 药物代谢物:药物在体内的代谢产物。
- 药物描述和疾病关联:药物的适应症、疗效等。
- 剂量数据:药物的使用剂量。
- 食物与药物相互作用:食物对药物作用的影响。
- 药物不良反应:药物可能引起的不良反应。
- 药理学、作用机制和代谢:药物的药理作用、作用机制和代谢途径。
- 化学合成:药物的化学合成方法。
- 专利和定价数据:药物的专利信息和定价。
- 化学性质、命名法和同义词:药物的化学性质和命名信息。
- 化学分类法:药物的化学分类。
- 药物NMR、GC-MS和LC-MS光谱:药物的光谱数据。
DrugBank 数据库的作用主要有两个方面:
- 临床导向的药品知识:提供关于药品靶点和药物作用的生物或生理结果的详细、最新、定量分析或分子量的信息。
- 化学导向的药品数据库:提供计算机检索药物、药物“复原”、计算机检索药物结构数据、药物对接或筛选、药物代谢预测、药物靶点预测功能。
DrugBank 数据库的官方网站是 https://go.drugbank.com/ ,在这个网站上,用户可以查询到各种药物的详细信息,并且可以申请下载权限来获取数据集。不过,需要注意的是,使用和重新分发内容或数据需要获得许可,学术用户可以申请免费许可,其他用户则可能需要付费许可。此外,DrugBank数据库的开放数据集是公共域数据集,可以在应用程序或项目中自由使用,并且是按照Creative Common的CC0国际许可证发布的 。(from kimi)
ATC系统是什么:
ATC分类系统,全称为Anatomical Therapeutic Chemical Classification System,即解剖学治疗学及化学分类系统,是由世界卫生组织(WHO)制定的用于药品的官方分类系统(https://www.whocc.no/atc_ddd_index/),这个系统根据药物作用的器官或系统及其治疗、药理和化学特性对药物的有效成分进行分类。ATC分类系统最初在1976年发布,并于1996年成为国际标准。
ATC分类系统将药物分为五个级别,具体如下:
- 第一级:由一位字母组成,代表药物作用的解剖学主族,共有14个主族,例如A代表消化系统及新陈代谢,C代表心血管系统等。
- 第二级:由两位数字组成,代表药物的治疗学副族,例如在心血管系统中,C03代表利尿剂。
- 第三级:由一位字母组成,代表药物的药理学副族,例如C03C代表利尿剂中的噻嗪类利尿剂。
- 第四级:由一位字母组成,代表药物的化学副族,例如C03CA代表噻嗪类利尿剂中的磺胺类药物。
- 第五级:由两位数字组成,代表具体的化学物质,例如C03CA01代表呋喃苯胺酸。
ATC编码系统在药物研发中的作用包括:
- 为药物研究提供标准化的分类方法,便于比较和分析不同药物的特性和用途。
- 有助于药物的注册、监管和市场准入过程。
- 支持药物使用监测和药物安全评估。
- 促进药物信息的国际交流和数据比较。
论文Improving drug–drug interactions prediction with interpretability via meta-path-based information fusion就是对所使用的药物数据集进行ATC分类划分,如下:
共14种划分
该论文使用到关联DDI的已批准药物共2410种,只有1937种drugs是有ATC codes的。文中有这么一段话,不太理解:
Specifically, if the two drugs in one DDI have different ATC codes, the DDI will be assigned to the corresponding two different DDI subgroups.
经查阅,这句话的意思是,在药物相互作用(Drug-Drug Interaction,简称DDI)的研究中,如果两种药物具有不同的ATC编码,那么这种药物相互作用会被归类到两个不同的DDI亚组中。
具体来说:
- 药物相互作用(DDI):指的是两种或以上的药物同时使用时,它们在药效、代谢、副作用等方面可能发生的相互影响。
- ATC编码:是世界卫生组织(WHO)制定的药物分类系统,用于标准化药物的分类。每种药物或药物类别都会被分配一个独特的ATC编码。
- DDI亚组:在研究和记录药物相互作用时,科学家们可能会根据药物的ATC编码将相互作用分类为不同的亚组,以便于更好地组织和分析数据。
例如,如果药物A的ATC编码是C07(代表一类心脏药物),而药物B的ATC编码是J02(代表一类抗真菌药),那么这两种药物之间的相互作用会被归类到DDI数据库中的两个不同的亚组:一个与心脏药物相关的亚组,另一个与抗真菌药物相关的亚组。这样做可以帮助研究者快速识别和研究特定类型的药物相互作用,以及它们在不同治疗领域中的影响。