跟着无神一起读PAPERS 之Day3 能够预测影响蛋白质功能的变异的语言模型

AIzealot无

已于 2023-09-21 18:11:11 修改

阅读量65

点赞数

文章标签：语言模型人工智能自然语言处理学习迁移学习

于 2023-09-21 18:10:43 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_72806612/article/details/133138518

版权

一、前言

欢迎来到跟着无神读PAPERS系列之Day3！

本篇内容选自NeurIPS-2021-language-models-enable-zero-shot-prediction-of-the-effects-of-mutations-on-protein-function。

作者分别来自Facebook的AI实验室；伯克利和纽约大学。

属于CCFA类，是机器学习和计算神经科学领域的顶级国际学术会议之一。

这篇文章的主要贡献是：发现了使用蛋白质序列训练的语言模型能够务监督地预测其作用机理。

其模型主要架构如下：

二、核心方法

2.1 零次学习

什么是零次学习呢？

零次学习能够是模型识别出没有经过训练的延伸类。

意味着零次学习指的是使用完全没有经过该任务训练的模型，去解决陌生的任务，就是说是个完全的迁移学习任务。

也就是说，模型被训练一次以后，就能用于多个任务，具有通用性，这种特性是语言模型（现在应该叫大语言模型LLMs比较贴切）。

零次学习有个必要条件：预训练的数据需要跟将来延伸到的任务有一定的重合性，毕竟学习到的特征将来需要迁移到这种任务领域。

本研究中，使用的蛋白序列也是将来会进行预测其作用机理的任务上进行使用。

2.2 蛋白语言模型的性能对比

本研究对比了三种无监督蛋白语言模型。

几乎所有模型都是用masked语言模块进行训练。

最后·，选择了MSA转换器，在大型数据库MSAs上训练，然后使用MSA作为输入的推理。

三、模型的训练

模型在九千八百万条蛋白序列上进行了训练，需要注意的是，这里进行的不是有监督训练。

而是通用型的。

只是用到序列进行训练，没有打标签。

四、模型的评估

模型选用实验的数据进行评估打分。

模型比目前最先进的几种模型的平均性能高了很多，达到了state-of-art。

五、无监督微调

这里使用了各种冻结参数的方法在微调期间。

六、结果

模型能够预测各种分子基础的蛋白功能

六、意义

这里用到的无监督思想的生物内涵：

蛋白的生物特性能够直接从其结构被学习出来，也就是其结构体现其功能，这样就是为什么这里能够用得到无监督学习的零次学习特性。

七、结语

至此，该文章的核心内容介绍完毕，有疑问可以评论区讨论。

欢迎关注无神一起读Papers。

码字不易，点赞收藏加关注。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
跟着无神一起读PAPERS 之Day3 能够预测影响蛋白质功能的变异的语言模型

至此，该文章的核心内容介绍完毕，有疑问可以评论区讨论。欢迎关注无神一起读Papers。
复制链接

扫一扫

AIzealot无 CSDN认证博客专家 CSDN认证企业博客

码龄2年

哈尔滨工业大学（威海）

79: 原创

72万+: 周排名

2万+: 总排名

3万+: 访问

: 等级

1366: 积分

549: 粉丝

557: 获赞

29: 评论

466: 收藏

私信

关注

热门文章

分类专栏

最新评论

旷视 | 2025届MegEagle创视者计划正式启动！
AIzealot无: 有想来AI三小龙的朋友们可以大胆投递
跟无神学AI之Unet解读——原创
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
跟无神学AI之一文读尽Sora
AIzealot无: 进一步学习的方法：看相关参考文献尤其是其中的核心技术；参与开源社区的相关讲座和讨论
以YOLOv8为例详解YOLO系列
CSDN-Ada助手: 恭喜您撰写了第20篇博客！标题中提到以YOLOv8为例详解YOLO系列，这无疑是一个非常有趣且有价值的主题。通过深入剖析YOLOv8，您不仅向读者展示了对YOLO系列的深入理解，还为那些对目标检测感兴趣的人提供了宝贵的参考。在继续创作的道路上，我想给您一些建议。首先，您可以考虑更进一步地探索YOLO系列的相关技术和应用。比如，可以尝试分析YOLOv4和YOLOv5的优缺点，或者讨论YOLO在特定领域的应用案例。此外，您还可以关注一些与YOLO系列相关的最新进展，例如YOLOv9的研究成果。这样的创作会使您的博客更具前沿性和吸引力。再次恭喜您的持续创作，并期待您未来更多精彩的文章！请保持谦虚的态度，继续分享您的知识和见解，为读者带来更多有价值的内容。加油！
FAT技术
CSDN-Ada助手: 恭喜您写的第19篇博客！标题中的“FAT技术”引起了我的兴趣。您的持续创作真令人钦佩。不过，如果我可以提一个谦虚的建议的话，我觉得下一步您可以深入探讨一下FAT技术的实际应用场景，或者与其他相关技术进行对比分析，以使读者更好地理解和应用这项技术。期待您在未来的创作中继续展示您的才华！

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。