一、案例简介
Insilico Medicine公司使用AI技术,在短短46天内设计并筛选出了一个DDR1受体抑制剂,这个化合物在小鼠体内具有较好的药代动力学性质,有望继续改造并用于治疗纤维化相关的疾病。该结果于2019年9月2日发表在Nature Biotechnology上。
Nature Biotechnology杂志最新影响因子IF为31.864分。尽管近几年IF有所下滑,但是仍然在生物技术领域的杂志中稳居前3,年刊文量也只有100篇左右,所以能投中的还是有两把刷子的。
二、团队背景
这篇文章的通讯作者为Alex Zhavoronkov,所属单位是一家香港公司Insilico Medicine Hong Kong Ltd。香港的这家公司成立于2019年1月11日,5个月后,又在上海成立了一家子公司:英矽智能科技(上海)有限公司。除了这两家公司之外,还有另一家美国公司InSilico Medicine,该公司成立于2014年1月1日,最近在2019.9.10日完成了3700万美元的B轮融资,投资机构里不乏启明创投、创新工场等大厂。这种美国+香港+上海的配置,不由得想起了VIE架构。InSilico Medicine前年在台湾成立药物研发基地,去年又将总部搬至中国,可能是看上了中国相对廉价的劳动力和广阔的药物市场。
此外,文章也提到了WuXi AppTec Co., Ltd,也就是药明康德。药明康德为这份研究选择并提供了治疗靶点,即一种酪氨酸激酶受体discoidin domain receptor 1 (DDR1),该受体在上皮细胞中表达并参与肌成纤维细胞激活、胶原沉淀、炎症反应等生物过程。此外也负责了化合物的合成和生物学功能验证。而药明康德不仅是InSilico Medicine的合作伙伴,也是投资方之一。药明康德靠化学合成起家,随后在20年的发展中,业务扩展到药物研发各个环节中,也难怪能与InSilico Medicine衔接地这么紧密,25天就完成了AI设计分子的合成与验证工作。而两年前对InSilico Medicine的投资,也可以看出药明康德在AI医药方向上早有布局。
三、靶点与抑制剂
自从2013年以来,至少报道了8种不同的化学结构,对DDR1或DDR2具有活性。而罗氏公司在2018年使用DNA encoded library (DEL)筛选得到了一种带有吲哚的螺环类化合物,可以抑制DDR1磷酸化,并且该化合物对于DDR1的活性比DDR2高64倍,在小鼠模型上具有治疗肾纤维化的潜力,有可能用于人的慢性肾病治疗。而全球约有10%的人(7.5亿)受该疾病困扰。
目前可以搜索到1269条和365条分别针对DDR1和DDR2的小分子筛选数据,而准确记录了活性值的数据分别有1206条和253条。在这实验数据中,DDR1靶点活性值的二分之一分位值为63 nM,四分之一分位值为26.3 nM,而DDR2的相应数据分别为101 nM,和18 nM。文章中报道的最优化合物在酶学水平对DDR1的活性值为10 nM,也是超过了一大批已知化合物。
四、分子设计过程
Insilico Medicine使用生成模型generative tensorial reinforcement learning(GENTRL),针对DDR1靶点,在21天里设计并生成了一批潜在抑制剂,并从可合成性、活性、新颖性、类药五原则等角度进行筛选,并选择6个化合物进行测试,2个都表现出了纳摩尔级别的活性及一定的选择性,并具有不错的药代动力学性质。具体设计过程如下。
首先在ZINC数据集上进行预训练、随后在DDR1激酶抑制剂和普通激酶抑制剂数据集上再进行训练,接着在非激酶抑制剂数据集上进行强化学习,得到了3w个初筛分子,然后通过警戒结构、反应基团、聚类和多样性排序进行过滤,再使用特异激酶的SOM、基于受体结构的药效团模型和sammon映射进行评估,得到了具有潜在活性的分子集。从该分子集中,根据化学空间和RMSD值均匀地进行随机挑选,得到40个分子,其中39个都在专利覆盖范围之外。另外值得注意的是,上述筛选得到的分子中,出现了一些类似生物电子等排体替换和拓扑修饰的分子结构。根据合成难易程度,挑出6个合成并在酶学水平上进行验证,4个对DDR1都具有抑制活性,IC50分布在10-1000 nM之间。活性最强的两个化合物1和2在细胞水平上也表现出了抑制纤维化的活性,IC50分别为10.3和5.8 nM。体外微粒体稳定性实验表明,1和2的半衰期和清除率与对照相当,且不会强烈抑制细胞色素P450酶(该酶对药物代谢起着很重要的作用)。最终选择化合物1进行体内药代动力学实验,并从量子力学和分子对接的角度解释了作用机制。
五、专利分析
该公司于2019.10.17申请了一份专利,并在2020.4.23公开,申请号:WOIB19058885,申请公布号:WO2020079652A1。该专利涉及一类可作为DDR1抑制剂的分子结构、合成步骤及使用方法。保护的母核结构举例:
上图中A和B可以是单个或多个稠环结构,可以是脂肪环、芳香环、也可以带有杂原子,组成环的原子数量可以在4-12之间。A和B环可以含有一个或多个取代基。Y是一个连接结构;X1-5可以是碳原子或杂原子,允许带取代基,也可不带取代基。R1-6代表长度不同的取代基,其中R5和R6处也可以为空。
筛选出的具有潜力的化合物结构如下图所示:
通过对已知化合物计算摩根分子指纹,使用TanimotoSimilarity计算相似性,挑选最相似的前6个分子进行查看,可以看到设计出的新化合物比已知的分子多了异恶唑结构,或许会成为针对DDR1靶点的一个me too或me better药物。