![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
AMP
文章平均质量分 77
XANTAR____RES
这个作者很懒,什么都没留下…
展开
-
【大模型多肽发现、学习笔记】使用预训练语言模型做embedding的AMP预测方法——LMPred
基于目前AMP是潜在的癌症治疗和高血压治疗的新药,同时新AMP的发现能够缓解耐药细菌问题,而常规的湿实验周期长、开销大,因此开发一种计算方法是解决这一问题的有效方式。本文作者提出一种新的AMP预测方法——LMPred,它由一个预训练好的语言模型(用于embedding)和CNN分类器(用于预测)组成,且在不同的数据集上取得了很高的预测精确度,同时优于目前最优秀的分类模型。通过使用预训练的LM模型embedding,最终使得分类任务优于目前已知的最优秀的方法。原创 2023-07-23 09:32:26 · 235 阅读 · 0 评论 -
【大模型多肽发现、学习笔记】基于序列多维特征嵌入的AMP预测方法
AMP是生物体内产生的具有杀菌活性的碱性物质,天然的AMPs还具有如伤口愈合、抗氧化和免疫调节作用等重要活性,AMPs被誉为是抗生素最好的替代品。本文作者提出一种新的深度学习方法来预测AMPs,其可以高精度的分类出10~200长度的AMP和non-AMP,同时结果表明,在不降低其他指标的情况下此模型依旧可以在独立数据验证方面的精度比目前最好的模型还高1.05%。可以看出,不同的encoding方法都有各自的优点和各自的缺点,本文通过结合它们来互相弥补达到更好的预测效果。模型结构如上图所示。原创 2023-07-21 10:26:01 · 108 阅读 · 1 评论 -
【大模型多肽发现、学习笔记】AMPlify——预测AMP的深度学习工具
两个模型都是基于基础的AMPlify模型,其结构如下图所示。本文作者推出了一种基于深度学习的模型,AMPlify,其在预测AMP任务中表现突出,而且优于现有的SOTA算法。在本文的工作中,作者训练了两个模型,一种是基于平衡数据集的,而另一种是基于非平衡数据集的。其次,本文收集的non-AMP数据存在一定瑕疵,因为虽然工作中是按关键词在Swiss-Prot数据库中进行筛选,但仍有一小部分non-AMP数据是具有Antimicrobial特性的,所以作者提出可以在训练模型任务中加入噪声进一步优化模型。原创 2023-05-23 16:16:16 · 179 阅读 · 1 评论 -
【大模型多肽发现、学习笔记】AI4AMP——预测AMP的深度学习工具
对于non-AMP数据,其主要由真实世界中的肽(取自UniProt database)和人工合成的肽序列组成,最终也是获得了6623个肽序列。其核心是对每一个氨基酸的相关物理化学特性进行词嵌入(word embedding),得到一个矩阵,它每一行代表一个氨基酸的6个物理化学特征的值(经过归一化处理后的)。本文工作使用的评估指标为Accuracy、Precision、Sensitivity、Specificity、F1 score和MCC(Matthew correlation coefficient)。原创 2023-05-22 18:41:28 · 217 阅读 · 1 评论 -
【大模型多肽发现、杂谈】AMPs研究的一些领域知识
肽的氨基酸特征就是肽的序列,即将每个氨基酸表示成一个字符后形成的序列。通常不直接使用序列作为输入(除一些基于RNN的方法),而是使用embedding layer提取有代表性的特征。将序列数据编码成数值信息的方法主要分为两类:基于肽特征的和基于氨基酸特征的。它学习到的每一个embedding都是输入序列的函数,具体地说,它从不同上下文中获取字符使用方式并且根据不同上下文中的相同字符来产生其不同的表征。一、基于肽特征的方法又进一步分为两种,即基于序列特征的和基于结构特征的。二、基于氨基酸特征的方法。原创 2023-05-21 17:01:14 · 153 阅读 · 1 评论 -
【大模型多肽发现、学习笔记】CNN模型——对AMP序列的K-mer分析
本次工作使用了其中的2342条动物、352条植物和349条细菌类的AMP序列,据统计,平均AMP序列长度为33.30个氨基酸,标准偏差为22.01个氨基酸。训练集:验证集=80:20,在经历10个epochs的实验测试可得2-mers、3-mers、4-mers分别在3、3、2个epochs后停止训练模型可以防止过拟合(overfitting)。的方法,其把这些英文表示的氨基酸序列切分成K-mers(K=2,3,4),来作为模型的输入预测特征,最终对来自三个物种(动物、植物和细菌)的AMP序列做分类。原创 2023-05-14 10:58:28 · 168 阅读 · 2 评论