PreTrain
文章平均质量分 92
soccqy
这个作者很懒,什么都没留下…
展开
-
阅读笔记-蛋白质序列预训练ESM
阅读笔记-Biological structure and function emerge from scaling unsupervised learning to 250 million protein sequences概要数据与模型同源性建模概要 \,\,\,\,\,\,\,\,\,数十年来,公共数据库中蛋白质序列数量的增长呈指数趋势,从而深入了解了整个生命中蛋白质序列的广度和多样性。 该数据为使用人工智能研究生物学的预测和生成模型提供了有希望的基础。 本文的重点是使单个模型适合原创 2021-02-20 00:27:35 · 11270 阅读 · 0 评论 -
阅读笔记--Protein PreTrain
阅读笔记--Pre-training Protein Language Models withLabel-Agnostic Binding Pairs Enhances Performancein Downstream Tasks1、预备知识1.1 Longformer1.2 BPE介绍2、相关工作3、方法2.1 数据集下游任务单个的蛋白质序列分类成对蛋白质序列分类token级分类(序列标注)1、预备知识1.1 LongformerLongformer是一种可高效处理长文本的模型,传统Transfor原创 2020-12-19 20:16:44 · 797 阅读 · 1 评论 -
阅读笔记--TAPE--NIPS2019
阅读笔记蛋白质介绍蛋白质的基础问题蛋白质家族概要方法数据集蛋白质介绍蛋白质对于生物的运转必不可少,从运输氧气的血红蛋白到人眼中的感光蛋白,从运输离子的输运蛋白到肌肉中的肌肉蛋白,它们的存在为生命造就多姿多彩的发展。理解蛋白质的结构和损坏机理不仅能够让我们对疾病的分子学机理有着更好的了解,更能帮助我们找到更好的方式对抗疾病!蛋白质除了是维生的必要物质,更是生产各种抗体和疫苗的有效方式,同时还可以通过个性化改造让细菌具有分解废物的能力,生产出具有去污功效的酶。如果能够更深入地理解蛋白质,更多的新功能就可以被原创 2020-12-18 16:26:11 · 1223 阅读 · 0 评论