【模型复现】零样本预测文本分类模型——ESM 快速复现模型

本文档提供了Facebook AI Research的ESM(Embedding of Sequence Motifs)模型的快速复现教程,该模型基于Transformer,用于蛋白质序列的无监督学习。通过在大规模蛋白质序列数据上训练,ESM-1v模型展示出在零样本预测任务中的优秀性能,证明了预训练语言模型可以捕捉到生物领域的知识。复现步骤包括环境准备、模型配置及训练数据的准备。
摘要由CSDN通过智能技术生成

ESM

快速复现教程

01 镜像详情

镜像简介

这篇论文《Biological structure and function emerge from scaling unsupervised learning to 250 million protein sequences》 .是2019年2月的文章,发布在biorxiv上。代码中包括来自 Facebook AI Research 的 Transformer 蛋白质语言模型的代码和预训练权重,包括我们最先进的 ESM-1b 和 MSA Transformer。并且论文中介绍了 Transformer 蛋白质语言模型。介绍了一个新的蛋白质语言模型ESM-1v,它具有与目前最先进的突变预测模型相媲美的零样本预测的能力,说明了使用大量多样的蛋白序列数据训练的语言模型可以在无需监督式学习的情况下预测蛋白功能的实验测量结果。模型在零样本场景的泛化说明了大型预训练语言模型捕获领域知识的潜力,这可能有助于生成新的功能蛋白。 

应用场景:文本分类、文本匹配、文本生成

论文地址:

https://www.biorxiv.org/content/10.1101/622803v4

02 平台环境准备

  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值