![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
生物大模型
文章平均质量分 94
kirov1024
这个作者很懒,什么都没留下…
展开
-
生物大模型文献及代码精读(三)找到所有物种的通用基因?
做了什么?在这里我们介绍SATURN(翻译为土星),一种基于蛋白质语言模型的通用细胞嵌入编码基因的学习方法。通过整合来自不同物种的数据集及基因组相似性,作者提出了一种Macrogenes,用于综合不同基因跨物种共表达;作者基于这种embedding方法,将其用于单细胞多物种整合等下游任务,效果拔群;同时还展现了识别位置基因的功能的作用。意义是什么?解决跨物种分析难题增强对细胞类型的理解:SATURN方法通过整合不同物种的单细胞RNA测序数据,揭示了细胞类型在进化过程中的保守性和多样性。原创 2024-05-09 22:31:43 · 522 阅读 · 1 评论 -
生物大模型文献精读(二)GenSLMs大模型探索SARS病毒的遗传变异
背景是什么RNA病毒(如SARS-CoV-2)在宿主感染期间高频率突变和快速适应的能力。监测和解析这些变异对于追踪疫情传播、评估病毒传染性、致病性及免疫逃逸能力至关重要。做了什么?GenSLMs通过预训练于超过1.1亿个原核生物基因序列,并针对150万个SARS-CoV-2基因组进行精细调整,展现出能够快速、准确识别关注变异株(Variants of Concern, VoCs)的能力。意义是什么?这种模型具有泛化能力,有望应用于其他预测任务,标志着在病毒新变种识别与分类方法上的革新。原创 2024-04-09 21:47:02 · 884 阅读 · 0 评论 -
生物大模型文献及代码精读(一)scGPT——3000万细胞的预训练模型?
做了什么?建立了一个基于超过3300万个单细胞数据细胞的生成式预训练transformer,主要同时学习细胞和基因的表达。意义是什么?促进预训练模型在各种不同任务中的应用,如细胞类型注释、基因扰动预测、批次校正和多组学集成等方面,展最终实现“通用预训练,按需微调”。话外:预训练模型到底是什么?自己练了一套花拳绣腿,但是自己修为不够,发挥不了这招式的威力,所以找高手传输内力,使得自己的花拳绣腿也威力强大起来了。原创 2024-03-06 18:08:27 · 1718 阅读 · 4 评论