2021-04-12

HERB:中药高通量实验和参考数据库
引言
目前,药理转录组学已成为评估药物疗效和发现新药靶标的有力方法。最近,中药的研究已越来越多地转向高通量转录组筛选,以了解中药/成分的分子作用,确定对应的基因靶标,并与现代各种疾病关联起来。但这些数据都还未系统整理,供中医药研究使用。为更好支持中医药现代化,用数据指导现代药物发现,北京中医药大学、中国科学院计算技术研究所和四川大学华西医院肾脏研究所组成研究团队共同建立了HERB数据库,这是专门的中药高通量实验和参考数据库,中文名叫BenCaoZuJian(本草组建),该数据库可通过http://herb.ac.cn/网址访问。
在这里插入图片描述
HERB背景简介
全面了解化合物的分子效应,有助于候选药物筛选和药物发现。传统上,评估活性分子效应通常使用细胞模型和动物模型进行功能试验,通过高通量技术来识别治疗或扰动作用来研究整个转录组的变化。此类最大的现代药物数据库是CMap,包括转录组水平的扰动数据集,该数据集包含九个细胞系核心组中成千上万个具有良好注释的小分子。此外,还有其他类似的数据可从存储功能基因组数据集的数据库中获得,例如GEO。最近,这种转录组学效应数据集的应用爆炸式增长,已经改变了药理学领域,能帮助研究人员迅速找到治疗疾病的潜在化合物。例如,最近将Celastrol的基因表达图谱映射到减少内质网应激(ER)的基因表达谱(一种与肥胖症紧密相关的疾病)中,找出了一种化合物celastrol,它可以作为瘦素致敏剂来治疗肥胖症。同样,通过CMap库分析那些基因表达谱与Celastrol相似的小分子,发现了治疗肥胖的另一种瘦素敏化剂枯草杆菌素A。
中药为现代药物的发现和开发提供了丰富的物质基础。诸如DrugBank中有97种批准的药物是从中药中提取的,例如麻黄碱、青蒿素。中药用药经验及其处方是建立在数千年的民间试验基础之上的,包含许多具有改善临床疗效、治疗多种疾病的天然产物。因此,中药活性成分的分离及作用机理分析为新疗法提供了希望。
随着新一代测序技术的出现,越来越多的中医药研究使用高通量技术鉴定活性中药和分子作用。例如,自2006年和2011年以来,微阵列和RNA测序方法已分别用于中医药研究。到2019年,GEO数据库中有超过6000个样本经过细胞系,动物或患者的中药/成分治疗。快速积累的天然产物相关组学数据为理解每种中药/成分引起的转录反应和调节变化提供了新的机会。重要的是,这些数据可以映射到CMap,来系统地评估中药成分与现代药物之间的相似性,从而为研究中药作为新型疗法(如中药HUB)的候选药物提供数据支持。但是,由于数据的多样性,目前尚无系统规范的数据库来组织这些中药实验的高通量数据。
虽然,2011年发布的HIT数据库包含从PubMed中收集的586种中药成分相关的1,301个基因靶标。2012年发布的TCMID数据库包含从维普中收集的680种中药靶标。但是,中药靶标、中药疾病和成分疾病之间的典型关联集从未收集,也未加以整理。建立一个高可信度的数据库,将靶点、疾病和中药/成分联系起来,为中医药与现代药物之间提供高质量的,循证的联系非常必要。
因此,研究团队建立了中药高通量实验和参考指南数据库HERB(中文名“本草组鉴”)。 HERB集成了多个TCM数据库,包含了迄今为止最全面的中药和成分列表。研究团队重新分析了1037个中药/成分的高通量实验评估的6164个基因表达谱,并通过将HERB中完整的药理转录组学数据集映射到CMap,在中药/成分与2837种现代药物之间建立了联系。并且从1966篇最近发表的文章中,手动选择了473种中药/成分中1241个基因靶点和494种现代疾病,将该新信息交叉引用到包含此类药物数据的数据库中。结合数据库挖掘和统计推断,将12933个靶标和28212个疾病与7263种中药和49258种成分相关联,并在HERB中提供了它们之间的六种成对关系。HERB将为中医药现代药物发现的药理研究提供了有力的数据支持。
在这里插入图片描述
表1:HERB数据概况一览表
图片来源Nucleic Acids Research

HERB的组建方法
1、准备中药和成分列表
首先准备中药和成分的非冗余列表,并通过集成多个TCM数据库(包括SymMap,TCMID 2.0,TCMSP 2.3和TCM-ID)确定它们之间的关系。所有成分的分子式和分子smile信息根据化学数据库SciFinder和PubChem进行标准化。然后,将中药成分映射到DrugBank数据库,并将一部分中药成分标记为批准的药物。最后,搜索了活性中药成分的权威数据库“国家中药化学成分数据库”(http://cintmed.cintcm.com/cintmed/)。
2、获取中药及其成分的高通量实验数据
从GEO高通量实验中收集了多种细胞类型或动物模型研究中药或成分的公共数据。只保留了人或小鼠生成的数据集,这些数据集是通过典型的批量RNA测序平台(Illumina)或微阵列研究获得的。然后建立不同的管道来统一重新分析RNA seq和微阵列数据。
3、差异表达分析和功能富集分析
对每种中药/成分进行了差异表达分析。 首先,手动提取样本之间的比较关系。在相同条件下进行的一组对照样品和处理样品,称为HERB实验(EXP)。为了确保可重复性,我们在每个EXP中至少需要对处理样品进行两次生物学重复。来自人或小鼠的EXP数据已合并并分开显示。然后,合并了具有多个EXP的中药/成分的分析结果。
4、中药/成分与现代药物的数据映射
建立了中药/成分的基因表达谱后,将HERB-EXP映射到CMap,进一步评估了中药/成分与现代药物之间的相似性,CMap包含成千上万个带有批注的小分子的pharmacotran脚本组学数据集。
5、手工整理中药和成分参考文献
通过PubMed文本挖掘收集了2011年至2020年与中医相关的论文。设置关键词和搜索范围,经过PubMed挖掘和层次过滤后,最终获得了17886篇参考文献。由博士阅读和提取17886篇参考文献的信息,由研究生进行了二次验证。根据NCBI命名法和GeneCards数据库进一步标准化新选择的中药靶标的基因名称,然后将它们与TTD数据库进行交叉引用。 然后,将疾病信息标准化为MeSH术语(https://www.nlm.nih.gov/mesh/meshhome.html)和DisGeNet数据库,并将它们与HPO和Disease Ontology数据库进行交叉引用。 此外,为了方便用户,在HERB-REF中选择了许多与临床相关的表型。 最后,将目标与疾病之间的关系从DisGeNet转移到HERB。
6、HERB数据库组成之间的其他关联
在确定HERB文献数据之前,SymMap,HIT,TCMSP和TCMID等数据库也已经确定了成分与靶标的关系。因此,我们将来自参考文献的和数据库挖掘的成分-靶标对合并在一起。其他关系,例如成分疾病,中药靶标和中药疾病,通常是通过组合两个或多个直接关系而间接链接的。
7、完成HERB组建
HERB提供了有关中药的信息,包括其成分,其基因靶标,现代疾病以及相关的高通量实验数据和人工整理的参考文献。HERB为用户提供了一个方便的Web界面,供用户浏览,搜索,可视化和下载数据。无需用户注册即可从http://herb.ac.cn免费访问HERB。 HERB网站是使用Python-Flask,Nginx和React JavaScript框架构建的,并且与大多数主流浏览器兼容,其数据存储在MySQL数据库中。
在这里插入图片描述
图1:HERB-EXP的构建和特征
图片来源Nucleic Acids Research
图1:(A)HERB-EXP中数据处理框架的四个连续步骤的示意图:1.从GEO实验(GSE)和样品(GSM)下载数据,提取每种中药/成分的HERB实验(EXP),并显示条形图中每种数据类型的GSE / GSM / EXP数。 2.对于每个EXP,请在小提琴图中说明对照和处理样品的生物学重复次数。 3.首先根据每个EXP的不同管道自动分析RNA-seq和微阵列数据,然后将每种中药/成分的多个EXP的结果合并在一起。 4.分别在火山图,条形图,点图或网络中可视化每个EXP的差异表达分析,GO和KEGG富集或CMap连接的结果,然后针对每种中药/成分可视化。(B)在火山图中显示了与四个中草药有关的四个中药成分(姜黄素,白藜芦醇,鱼藤酮和thapsigargin)中四个已知靶标(CDKN1A,DES,TNFRSF10B和DDIT3)的差异表达。 X轴显示与对照样品相比的表达变化,Y轴显示统计意义。四种颜色对应于四个目标成分对,并且两个形状指示每个EXP(鼠/人)的物种信息。(C)根据在CMap中映射的化合物,用HERB EXP数据对所有中药/成分进行分类。
在这里插入图片描述
图2:HERB-REF概述。
图片来源Nucleic Acids Research
图2:(A)每年发表的与中药/成分相关参考文献的数量统计。(B)条形图中显示了精选的中药/成分,目标/疾病的数量及其与HERB-REF的关联,其中四个方面显示了四种类型的关联:中药-目标,中药-疾病,成分-目标,和成分疾病。 (C)使用参考文献数据集对癌症相关疾病的有前途的中药或成分进行搜索和排序,这些中药/成分可以与免疫肿瘤学相关的靶标建立联系。(D)在点图中说明了基于目标和疾病的搜索所支持的所选中药/成分,其中X轴和Y轴分别显示了每次搜索的参考对象数。

在这里插入图片描述
图3: HERB搜索的示意图。
图片来源Nucleic Acids Research
图3:(A)HERB的搜索页面显示中药,成分,目标和疾病4个组成。(B)HERB的实验页面显示了所有与中药/成分有关的高通量数据,并通过HERB进行了分析。(C)HERB的参考页面显示了所有已发布的参考文献,其中包含有关中药/成分的准确目标/疾病信息。(D)示例成分雷公藤内酯的详细信息页面。(E)随后的雷公藤甲醚详细页面。网络中显示了雷公藤甲素及其相关化合物之间的关联性。请注意,所有图形都是以交互方式实现的,用户将鼠标悬停在它们上面就可以看到每个点/条/节点/边的详细信息。

爱菩新医药开发系列化学信息学系统、化学信息学数据库,支持以上中药/化学成分、靶标、疾病及参考文献数据库的建立,为您定制专属的药理转录组学数据库,欢迎关注并联系我们!

参考文献
ShuangSang Fang†, Lei Dong†, Liu Liu, JinCheng Guo, LianHe Zhao, JiaYuan Zhang, DeChao Bu, XinKui Liu, PeiPei Huo, WanChen Cao, QiongYe Dong, JiaRui Wu, Xiaoxi Zeng, Yang Wu*, Yi Zhao*.(2021), HERB: a high-throughput experiment- and reference-guided database of traditional Chinese medicine,Nucleic Acids Research.
DOI: 10.1093/nar/gkaa1063

原文链接
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7779036/

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值