![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
结构预测
文章平均质量分 79
XANTAR____RES
这个作者很懒,什么都没留下…
展开
-
【大模型多肽发现、学习笔记】使用预训练语言模型做embedding的AMP预测方法——LMPred
基于目前AMP是潜在的癌症治疗和高血压治疗的新药,同时新AMP的发现能够缓解耐药细菌问题,而常规的湿实验周期长、开销大,因此开发一种计算方法是解决这一问题的有效方式。本文作者提出一种新的AMP预测方法——LMPred,它由一个预训练好的语言模型(用于embedding)和CNN分类器(用于预测)组成,且在不同的数据集上取得了很高的预测精确度,同时优于目前最优秀的分类模型。通过使用预训练的LM模型embedding,最终使得分类任务优于目前已知的最优秀的方法。原创 2023-07-23 09:32:26 · 240 阅读 · 0 评论 -
【大模型多肽发现、学习笔记】基于序列多维特征嵌入的AMP预测方法
AMP是生物体内产生的具有杀菌活性的碱性物质,天然的AMPs还具有如伤口愈合、抗氧化和免疫调节作用等重要活性,AMPs被誉为是抗生素最好的替代品。本文作者提出一种新的深度学习方法来预测AMPs,其可以高精度的分类出10~200长度的AMP和non-AMP,同时结果表明,在不降低其他指标的情况下此模型依旧可以在独立数据验证方面的精度比目前最好的模型还高1.05%。可以看出,不同的encoding方法都有各自的优点和各自的缺点,本文通过结合它们来互相弥补达到更好的预测效果。模型结构如上图所示。原创 2023-07-21 10:26:01 · 115 阅读 · 1 评论 -
【大模型多肽发现、学习笔记】CNN模型——对AMP序列的K-mer分析
本次工作使用了其中的2342条动物、352条植物和349条细菌类的AMP序列,据统计,平均AMP序列长度为33.30个氨基酸,标准偏差为22.01个氨基酸。训练集:验证集=80:20,在经历10个epochs的实验测试可得2-mers、3-mers、4-mers分别在3、3、2个epochs后停止训练模型可以防止过拟合(overfitting)。的方法,其把这些英文表示的氨基酸序列切分成K-mers(K=2,3,4),来作为模型的输入预测特征,最终对来自三个物种(动物、植物和细菌)的AMP序列做分类。原创 2023-05-14 10:58:28 · 178 阅读 · 2 评论