来源:DrugAI
本文约1400字,建议阅读7分钟AMPEMO将抗菌肽设计公式化为一个双目标优化问题。
抗生素是能够抑制或是杀死病原微生物重要的药物。但是,随着抗生素的广泛使用,病原微生物对传统抗生素的耐药性已经成为越来越严重的问题。抗菌肽是一类极具潜力的抗菌药物。而目前的抗菌肽设计方法难以在海量的多肽序列空间种搜索性能优越的新型抗菌肽。
近日,湖南大学DrugAI团队联合安徽大学苏延森团队和俄克拉荷马州立大学Gary Yen团队,在计算智能顶级杂志IEEE Computational Intelligence Magazine上发表了题为“Evolutionary Multi-Objective Optimization in Searching for Various Antimicrobial Peptides”的文章,提出一种基于多目标进化算法的抗菌肽设计方法,可快速高效的获得抗菌活性高且多样性好的抗菌肽。湖南大学刘益萍教授为第一作者,安徽大学苏延森教授为通讯作者。
文章发表在IEEE Computational Intelligence Magazine上
1.多目标优化问题建模
图1
研究团队将抗菌肽设计问题转化为一个多目标优化问题,如图1所示。利用BERT模型预测出多肽的抗菌活性,作为第一个优化目标f1。同时提出一种新的计算多肽相似性的方法,结合小生境共享计算多样性,作为第二个优化目标f2。
2.多目标优化算法
图2
研究团队针对抗菌肽设计问题,提出一种多目标优化算法,如图2所示。通过交叉变异、环境选择产生新的候选抗菌肽,并将优质的候选抗菌肽存储在精英档案,提高学习效率。为了增强搜索能力,研究团队将局部搜索与进化算法相结合。在搜索后期,使用局部搜索算子对候选抗菌肽进一步开发。
3.实验结果
数据集:由Daniel等人提供,其中包含1778个来自于APD3的已被实验验证的抗菌肽和1778个来自于UniProt的经实验验证的非抗菌肽。
Baselines:LSTM RNN、AMP-LM、AMPGAN v2、LSTMAMP、标准的进化算法(sEA)、小生境进化算法(nEA)评估指标:Scalable Niching Method (SC)、Pure Diversity (PD)、Dissimilarity to Dataset (DD)、Self-Organizing Map (SOM)
不定长抗菌肽设计:结果如表1显示, '†'表示比较方法与AMPEMO有显著性差异,AMPEMO*表示不加局部搜索的消融实验,可以看出AMPEMO在每个性能指标上都优于其它方法(AMPEMO*的PD除外)。这一观察结果表明AMPEMO在发现各种抗菌肽方面是强大的。
表1
图3展示了通过SOM方法运行的每个方法获得的抗菌肽的分布。AMPEMO实现了比其他方法更多的红色和深蓝色方块。LSTM-RNN、AMP-LM和AMPGAN v2的结果似乎优于sEA和nEA,而LSTMAMP和nEA的结果接近。ISOM是SOM图的量化表示。
图3
定长抗菌肽设计:由于AMP-LM、AMPGAN v2和LSTMAMP无法产生固定长度的多肽,因此只有LSTM RNN参加定长抗菌肽设计实验比较。图4、5和6分别显示了AMPEMO和LSTM RNN获得的肽长度的平均SC、PD和DD值。并得出以下结论:(1)对于每个长度的抗菌肽设计,AMPEMO的SC和PD值都优于LSTM RNN。(2)随着长度的增加,两种方法的SC值都会变差。可能是由于搜索空间增大,设计更长的抗菌肽更复杂。(3)在大多数情况下,AMPEMO的PD值大于1,这表明AMPEMO所获得的抗菌肽的多样性高于随机产生多肽的多样性。(4)AMPEMO的DD值通常优于LSTM RNN。但当长度较长时,AMPEMO和LSTM-RNN的结果接近。可能是当长度较长时,数据库中的抗菌肽的数量相当小,这导致难以估计所获得的抗菌肽和数据库中的抗菌肽之间的不相似性。这些观察结果证实了AMPEMO可以在固定长度下生成具有良好多样性的AMP,尤其是当长度较小时。
图4
图5
图6
4.总结
研究团队提出了一种新的抗菌肽设计方法(AMPEMO)。AMPEMO将抗菌肽设计公式化为一个双目标优化问题。第一个目标是关于深度学习模型预测的抗菌活性,第二个目标是通过小生境共享估计多样性。并且提出了一种多目标进化算法来解决这个问题。该算法使用了一个基于分解的框架和一个精英档案,结合局部搜索策略以提高搜索效率。最后,研究团队将AMPEMO与标准的进化算法、小生境进化算法和四种目前最先进的基于深度学习的方法进行比较。实验结果表明,AMPEMO在设计优质抗菌肽方面优于现有比较方法。
编辑:黄继彦
校对:林亦霖