在之前的专栏文章《详解TCMSP数据库》一文中,我们有提到,“可能你想要研究的药物在TCMSP数据库中查不到成分,或者查到的成分大部分都是假阳性成分。”
这里的假阳性成分指的是什么呢?会对我们后续的步骤有什么影响吗?
本文就是来详细拆分该点的,希望大家有补充或斧正,积极于评论区或私信分享~
之所以会出现本文,主要是组里大家不同的药物在走网药后,发现关键成分几乎都落到了槲皮素这个成分上。
在大家疑惑之时,聪明美丽的小师妹juan 发现了一篇论文《网络药理学“异病-异方”关键成分筛选同质化现象思考_曾鹏》。让我们来研读下这篇论文。
请注意,因为该论文其实并不是如标题而言只考虑了关键成分筛选同质化,而是后续的网络拓扑分析等情况都有考虑进去,同时主要关注的是复方,所以如下我省却了其他部分,只关注于单药的成分筛选同质化。
1.前言(论文拆解)
1.1.成分筛选“同质化”现状
在 2021—2022 年 发表的 50 篇复方 NP 论文中,40 篇分布在消化系统、神经系统等不同疾病和相应不同方药(累计 150 余种中药)的论文,均存在仅依赖中药数据库情况、关键成分同质化的现象,包括槲皮素、山柰酚、β-谷甾醇、豆甾醇和木樨草素等广泛分布的化合物排名常位居核心。
与之形成对比的是,采用GS-MS、HPLC-Q-TOF-MS/MS等方法,通过实验结合质谱数据库、对照品比对,结合里宾斯基五规则进行物质基础鉴定,则并未出现明显“同质化”现象。
1.2.成分筛选“同质化”后果
物质基础“同质化”的出现:
- 违背、间接否认了中医的“同病异治”或“异病同治”等整体观思想与辨证内涵。
例如:临床报道舒眠胶囊(酸枣仁、合欢皮、合欢花、僵蚕、蝉蜕、灯心草等)与血府逐瘀汤(柴胡、桃仁、红花、当归、牛膝、川芎等)均能治疗失眠,但两者中医理-法-方-药并不完全一致,而部分NP研究显示两种复方关键活性成分(排名前列)均为槲皮素、山柰酚、谷甾醇、山柰酚等同质化成分。
- 干扰 Q-Marker 识别。
详见下文1.2.2
- 远期甚或阻碍中医药 NP 健康态发展。
1.2.1.什么是Q-Marker(中药质量标志物)(⭐)
2016 年,刘昌孝院士首次提出了中药 Q-Marker 概念,这些与中药功能属性密切相关的标示性化学物质可反映中药的有效性与安全性。
Q-Marker需要满足以下基本条件:
- 为中药材和中药产品固有存在的或加工制备过程中形成的化学物质;
- 化学结构明确且与中药功能属性密切相关;
- 可被定性鉴别和定量测定;
- 君药首选原则,兼顾臣、佐使药的代表性物质;
Q-Marker存在五原则:“有效性”、“特有性”、“可测性”、“传递与溯源性”及“配伍关系”。
1.2.2.Q-Marker和网药NP的关系(⭐)
虽然没有论文文献系统记载两者的关系,不过可以确定的是:
NP 的关键成分分析对中药复方的 Q-Marker 具有一定参考价值。
该句是作者该论文的话语,在此本人补充其他文献以佐证:
- 《Q-Marker Prediction of Astragali Complanati Semen Based on Fingerprint and Network Pharmacology》,详见:
https://academic.oup.com/jaoac/advance-article-abstract/doi/10.1093/jaoacint/qsae077/7821191
- 《Screening of potential antioxidant bioactive Q-markers of paeoniae radix rubra based on an integrated multimodal strategy》,详见
https://www.frontiersin.org/journals/pharmacology/articles/10.3389/fphar.2024.1447959/full
同时,作者还在该篇论文中提到:
- Q-Marker 的五原则(有效关联性、成分特有性、质量传递与溯源性、成分可测性和复方配伍环境)也对解决 NP 同质化问题具有重要指导价值。
- 其认为一个药物在NP中筛到的关键成分就应该是该药物的Q-Marker,如下图:
当然,这是最好的结果,但大部分的药物的Q-Marker都未知。
但如果我们药物的Q-Marker已知,而NP关键成分中甚至都没有筛到的话,那毋庸置疑,该筛选步骤的结果存在可疑性。
也就是说,我们也可以反过来利用Q-Marker进行NP分析,在此本人补充文献以佐证:《基于Q-markers筛选优化网络药理学分析的兰沁口服液抗炎作用机制探索》,详见:https://www.x-mol.com/paper/1619147659373789184/t?adv
1.3.成分筛选“同质化”原因探究
1.3.1.中药数据库暂缺乏质控、参数追溯
因为相信大部分读者都是数据库的使用者而不是开发者,所以这部分不做详解。感兴趣的这部分可以见论文原文。
作者在这里疑似浅浅批判了一下TCMSP数据库,弥补了我们在《详解TCMSP数据库》一文中没有论文支撑去批判TCMSP的遗憾hhh。
1.3.2.成分筛选策略缺乏精准性
大量NP论文采用口服生物利用度(OB)≥30%、类药性(DL)≥0.18作为筛选活性成分的准则。
事实上,OB 预测值不同数据库算法不一,研究人员易混淆与被误导,而且OB 也并不是评判成分活性程度的绝对指标。单一的OB、DL筛选标准未考虑中药实际作用及体内代谢影响。
例如:三七皂苷 R1(OB=4.27%,DL=0.13,三七根茎分离出的重要皂苷类化合物,广泛用于研究心血管疾病、抗纤维化、止血 、组织损伤的修复治疗等,被明确是 三七QMarker之一,无法被以上策略筛选。
而且广泛分布的化合物如槲皮素、山柰酚、β-谷甾醇、豆甾醇等,往往具有良好的 OB、DL。
特别,如果研究的药物为外用药等,更不应该以OB、DL为标准。
1.4.成分筛选“同质化”解决探讨
其实这部分,作者写了很多,包含以下几个方面:
- 建立、完善中药数据库
- 完善数据库中的中药产地、药用部位、炮制方法、剂量配伍、代谢参数、效-毒网络等指标
- 基于生理-病理学特征降低 NP 同质化成分作用干扰性
- 考虑疾病生理-病理动态发展过程
- 考虑药物作用时空靶向性
- 同质化或靶标少的成分应行独立验证
- 建立避免“同质化”成分筛选研究策略
- 生信实验互补多维度
- 靶点预测考虑多重性
- 网络加权整合多层次
然而依旧不是我们这群臭搞NP的人可以干的事儿/(ㄒoㄒ)/~~,在此依旧跳过。
2.Q-Marker查询
好的,结束以上一千多字的论文拆解,让我们回到Q-Marker本身。
首先该思考的就是,既然可以通过Q-Marker来排除假阳性成分,并且通过检查我们筛选的关键成分中是否含有Q-Marker来验证NP的阶段性正确(详见本文步骤1.2.2)。
那么我们该如何查询一个药物的Q-Marker呢?
最推荐的就是文献查询,
其次是通过中国药典查询,
最后才是基于SymMap数据库或ETCM查询(因为该数据库的数据基本都来自于如上两者)。
2.1.SymMap中的QC ingredients
在论文《网络药理学在中医药研究中的困境———我们该何去何从?》中提到,“SymMap数据库[ 29] 在各草药条目下收录的Q-marker 成分、血液成分、代谢成分与其他成分的检索标签, 可用于有效成分的直接检索。”
其实SymMap数据库官方写的并不是Q-marker成分
,而是QC ingredients
,如下:
而SymMap官方论文,并没有提及这个QC ingredients
的准确定义和计算标准。而现在的中医药领域也没有给出QC ingredients
的官方解释或定义。
所以其实SymMap数据库中的QC ingredients
等同于Q-Marker
的说法是存疑的。但我们还是浅浅对标一下吧。
2.2.ETCM2.0中的指标性成分
同样很有意思的是,ETCM2.0官网中的指标性成分的概念。
图源:吴茱萸的ETCM2.0搜索结果
在官网的help.pdf中可以看到如下:
其官方论文提到:值得注意的是,每种草药的标志成分定量信息是根据中国药典(2020 年版)提供的。
由此,我们可以知道ETCMv2.0的数据来源就是中国药典。
2.3.中国药典的含量测定部分
好的,那让我们查询一下2020版的中国药典的吴茱萸,相关部分如下:
基于此,我们也浅浅对标一下Q-Marker和指标性成分吧。虽然也查不到指标性成分的官方定义
3.Q-Marker占比
上文1.2.2中有提到大部分的药物的Q-Marker都未知
,那么已知的Q-Marker
占比到底大概多少呢?
数据类型 | 数 | 资源 |
---|---|---|
中成药 | 9872 | 中国食品药品监督管理总局 (http://eng.sfda.gov.cn/WS03/CL0755/) |
具有标志物成分定量信息的中成药 | 865 | 中华人民共和国药典(2020 年版) |
中药材 | 2079 | |
草药 | 2005 | 第四次全国中药材资源普查 (http://www.zyzypc.com.cn/), 中华人民共和国药典 (2020 年版), 权威中医书籍和词典 |
动物医学 | 44 | 中华人民共和国药典(2020 年版) |
矿物医学 | 30 | 中华人民共和国药典(2020 年版) |
具有标志物成分定量信息的中药材 | 50 |
数据来源:2023年,论文《ETCM v2.0: An update with comprehensive resource and rich annotations for traditional Chinese medicine》
可以看到,已知Q-Marker的中成药占比约8.8%,已知Q-Marker的中药材占比约2.4%,只能说路漫漫其修远兮啊。
4.中国药典
在上文2.3.步骤提到了中国药典,当前最新版的是2020版,查询可见:https://ydz.chp.org.cn/#/main
由于TCMSP的数据都来源于2010版中国药典,在此也列一下相关查询。
2010版的查询就比较麻烦,本人是通过这个网站:https://www.drugfuture.com/announce/123.html
,查询到对应页码之后再通过pdf跳转到相应页面后自己查看的。
如果有更好方法的朋友可以在评论区分享。
- 2010年版《中国药典》:
- 收载药品总数:4615种
- 其中中药品种:2136种
- 2020年版《中国药典》:
- 收载药品总数:5911种
- 其中中药品种:2711种
如上数据来自于gpt总结,仅供参考。