【大模型多肽发现、学习笔记】针对病毒感染的肽药物发现

XANTAR____RES

已于 2023-05-17 18:12:29 修改

阅读量204

点赞数

分类专栏：生成 AVP 文章标签：人工智能

于 2023-05-14 16:18:35 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/XANTAR____RES/article/details/130668600

版权

生成同时被 2 个专栏收录

3 篇文章 1 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

文献链接：Deep-AVPpred: Artificial Intelligence Driven Discovery of Peptide Drugs for Viral Infections | IEEE Journals & Magazine | IEEE Xplore

doi：10.1109/JBHI.2021.3130825

摘要

人畜共患病病毒一直是人类面临的难以解决的问题，COVID-19流行病就是一个例子。而已知的抗病毒药有效力低、副作用强等很多缺点，所以人们开始关注于自然物质的抗病毒能力。动植物可以产生AVPs（antiviral peptides）来阻止病毒入侵本体，但获取这些AVP来合成肽药物又贵又花时间。因此，本文提出一种计算方法来识别新的AVP，方法名为Deep-AVPpred，其使用转移学习（transfer learning）理念结合深度学习算法来从蛋白质序列中发现AVPs。同时，基于这一方法，我们推出了网页工具Deep-AVPpred，其可以用于帮助抗病毒药物工作预测新AVPs。

数据集

在本文工作中，我们从AVPpred、DBAASP、DRAMP、SATPDB、StarPep中收集10203种AVPs，再从AVPpred、Swiss-Prot中收集8792种non-AVPs。经过一系列标准筛选后，最终所使用数据集为4090种non-AVPs和4090种AVPs.

模型框架

Deep-AVPpred模型结构如下图所示，

数据预处理。基于transfer learning理念使用了前人的工作得到的pretrained embeddings，其使用长1280的向量来编码肽序列的每一个氨基酸。
输入层，使用前一步处理后的数据，肽序列长度限定为∈ [5,50]，同时用0向量补齐空缺。
4层并联的1-D卷积层。卷积核大小依次为4、5、6、7，各filters大小都为200，以及激活函数为ReLU。
相应的4层1-D Global Max池化层。进行下采样任务，然后将4层输出concatenate（堆叠）起来。
Independent Component Layer。用的前人的工作，可以更稳定学习、更快收敛速度、更好泛化能力。
4层串联密集层（全连接层）。依次含有64、32、8、1个神经元，前三层使用ReLU为激活函数，最后一层使用Sigmoid做激活函数，输出值∈ [0,1]。
权重更新，使用的Adam（Adaptive Moment Estimation）优化策略。

实验

分类评估指标方面，本文使用的是经典的Accuracy、Sensitivity、Precision、F1-Score、Specificity、area under ROC curve（AUROC）。同时，与目前的SOTA算法进行对比，算法有AVPcompo、iAMPpred、Meta-iAVP、AVPIden、ENNAVIA-B。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

XANTAR____RES CSDN认证博客专家 CSDN认证企业博客

码龄3年

16: 原创

130万+: 周排名

24万+: 总排名

5122: 访问

: 等级

199: 积分

30: 粉丝

36: 获赞

10: 评论

34: 收藏

私信

关注

热门文章

分类专栏

抗体设计 2篇
生成 3篇
GNN 2篇
分子性质预测 1篇
AMP 6篇
结构预测 3篇
ACP（AMP） 1篇
AVP 1篇

最新评论

FAENet | 面向材料建模的EGNN模型
CSDN-Ada助手: 恭喜您发布了第15篇博客！您对于FAENet面向材料建模的EGNN模型的深入探讨让我受益匪浅。希望您能继续分享关于材料建模方面的研究成果，或许可以考虑探讨一些实际应用案例，让更多读者能够从中受益。期待您的下一篇作品！
3D Infomax | 改进GNN + 分子性质预测
CSDN-Ada助手: 恭喜你写了第14篇博客！标题中的3D Infomax和改进GNN的技术引起了我的兴趣。你对分子性质预测的研究能够为科学界做出重要贡献。不过，我希望在下一篇博客中能够更多地了解你的实验设计和结果分析，这样我们可以更深入地理解你的研究成果。希望你能继续保持创作的势头，期待看到你的下一个博客！
【强相关文献】CSM-Toxin，网站，可预测蛋白毒性
CSDN-Ada助手: 恭喜您写作了第9篇博客，题目非常吸引人！您的博客内容关于CSM-Toxin的预测蛋白毒性网站，似乎与最新的相关文献有着紧密的联系。这显示了您对当前领域的深入研究和了解。希望您能继续保持这种积极的创作状态，并继续分享您的见解和发现。接下来，或许您可以考虑加入一些对于这个网站的具体使用方法或者对于该领域未来发展的展望等内容，这将为读者提供更多有价值的信息。希望我的建议对您有所帮助，期待您的下一篇博客！
【大模型多肽发现、学习笔记】基于序列多维特征嵌入的AMP预测方法
CSDN-Ada助手: 恭喜您撰写了第10篇博客！您的标题“【大模型多肽发现、学习笔记】基于序列多维特征嵌入的AMP预测方法”非常引人注目。通过这篇博客，您分享了关于AMP预测方法的学习笔记，深入探讨了基于序列多维特征嵌入的方法。这是一个非常有价值的主题，我从中学到了很多知识。在评论中，我想鼓励您继续保持创作，并分享更多相关主题的博客。您的文章对于我们这些对AMP预测方法感兴趣的读者来说有着重要的指导意义。我期待着您未来更多关于多肽发现和学习笔记的分享，尤其是在大模型方面的应用。谦虚地说，您对这个领域的理解和经验将为我们带来更多新的视角和启发。再次祝贺您取得的成就，并期待您未来的创作！
【大模型多肽发现、学习笔记】AI4AMP——预测AMP的深度学习工具
CSDN-Ada助手: 非常感谢用户的持续创作，这篇关于AI4AMP的学习笔记非常有启发性。恭喜用户在探索大模型多肽发现方面的进步，同时也感谢用户分享这个预测AMP的深度学习工具。建议用户在接下来的创作中，可以进一步探索该工具的优缺点，并分享一些应用案例或实验结果，让读者更直观地了解该工具的使用场景和效果。期待用户更多的创作，为学界贡献更多有价值的研究成果。如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。