【强相关文献】CSM-Toxin，网站，可预测蛋白毒性

XANTAR____RES

已于 2023-07-24 19:57:47 修改

阅读量249

点赞数

文章标签：深度学习人工智能

于 2023-07-20 08:57:35 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/XANTAR____RES/article/details/131800396

版权

文献链接：Pharmaceutics | Free Full-Text | CSM-Toxin: A Web-Server for Predicting Protein Toxicity

代码：Bitbucket

摘要

现如今小分子药物、蛋白药物的发展趋势逐渐壮大，对临床试验具有很大的促进作用。然而，预测它们的毒性的方法都相对较慢、且效果不好。于是，文献的作者提出了一种基于深度学习的模型，来快速的预测这些药物的毒性，同时由于市面上没有很好的数据集，模型训练所使用的数据集是作者自己建立的，其包含的肽和蛋白数据都是高质量的且实验验证过的。模型在交叉验证和多次盲测测试中取得了在MCC标准下0.66的成绩。目前此方法可以在此网站中使用CSM-Toxin | Home。

数据集

本文建立的个性化数据集的数据来源于UniProt，通过如下图中所示的使用一些query以及使用CD-HIT技术来筛选所需要的数据，最终得到2475个有toxic属性的和214,740个non-toxic属性的序列数据。

值得注意的是，这些数据中有203个toxic和2337个non-toxic序列目前存在的方法中都使用过的，所以作者使用这些来组成test set来对比测试CSM-Toxin和ToxinPred2。同时还使用一组有236个正数据和21294个负数据来测试本文的算法性能，而其他的数据则平均分为5份来做交叉验证。

模型

本文的模型主要基于ProteinBERT。首先使用Masked Language Model technique来预训练模型，基于100 million个来自UniProt的序列数据，通过无监督学习的方式最终获得训练参数。CSM-Toxin模型结构如下图所示，其将ProteinBERT中的6个Transformer层的输出Global Representation output堆叠，然后在后面依次加入Dropout（0.5）、FC层和Sigmoid最终获得一个标量值，若其大于给定阈值，则判定为toxic，反之为non-toxic。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

博客等级

码龄3年

16
原创

36
点赞

34
收藏

30
粉丝

关注

私信

热门文章

分类专栏

抗体设计 2篇
生成 3篇
GNN 2篇
分子性质预测 1篇
AMP 6篇
结构预测 3篇
ACP（AMP） 1篇
AVP 1篇

最新评论

FAENet | 面向材料建模的EGNN模型
CSDN-Ada助手: 恭喜您发布了第15篇博客！您对于FAENet面向材料建模的EGNN模型的深入探讨让我受益匪浅。希望您能继续分享关于材料建模方面的研究成果，或许可以考虑探讨一些实际应用案例，让更多读者能够从中受益。期待您的下一篇作品！
3D Infomax | 改进GNN + 分子性质预测
CSDN-Ada助手: 恭喜你写了第14篇博客！标题中的3D Infomax和改进GNN的技术引起了我的兴趣。你对分子性质预测的研究能够为科学界做出重要贡献。不过，我希望在下一篇博客中能够更多地了解你的实验设计和结果分析，这样我们可以更深入地理解你的研究成果。希望你能继续保持创作的势头，期待看到你的下一个博客！
【强相关文献】CSM-Toxin，网站，可预测蛋白毒性
CSDN-Ada助手: 恭喜您写作了第9篇博客，题目非常吸引人！您的博客内容关于CSM-Toxin的预测蛋白毒性网站，似乎与最新的相关文献有着紧密的联系。这显示了您对当前领域的深入研究和了解。希望您能继续保持这种积极的创作状态，并继续分享您的见解和发现。接下来，或许您可以考虑加入一些对于这个网站的具体使用方法或者对于该领域未来发展的展望等内容，这将为读者提供更多有价值的信息。希望我的建议对您有所帮助，期待您的下一篇博客！
【大模型多肽发现、学习笔记】基于序列多维特征嵌入的AMP预测方法
CSDN-Ada助手: 恭喜您撰写了第10篇博客！您的标题“【大模型多肽发现、学习笔记】基于序列多维特征嵌入的AMP预测方法”非常引人注目。通过这篇博客，您分享了关于AMP预测方法的学习笔记，深入探讨了基于序列多维特征嵌入的方法。这是一个非常有价值的主题，我从中学到了很多知识。在评论中，我想鼓励您继续保持创作，并分享更多相关主题的博客。您的文章对于我们这些对AMP预测方法感兴趣的读者来说有着重要的指导意义。我期待着您未来更多关于多肽发现和学习笔记的分享，尤其是在大模型方面的应用。谦虚地说，您对这个领域的理解和经验将为我们带来更多新的视角和启发。再次祝贺您取得的成就，并期待您未来的创作！
【大模型多肽发现、学习笔记】AI4AMP——预测AMP的深度学习工具
CSDN-Ada助手: 非常感谢用户的持续创作，这篇关于AI4AMP的学习笔记非常有启发性。恭喜用户在探索大模型多肽发现方面的进步，同时也感谢用户分享这个预测AMP的深度学习工具。建议用户在接下来的创作中，可以进一步探索该工具的优缺点，并分享一些应用案例或实验结果，让读者更直观地了解该工具的使用场景和效果。期待用户更多的创作，为学界贡献更多有价值的研究成果。如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。