生物AI
loong_XL
这个作者很懒,什么都没留下…
展开
-
LLM生成大模型在生物蛋白质应用:ESM3、FoldToken、ProGen、ProtGPT2
参考:通过GPT模型原理,输入蛋白质序列等模态输出预测的蛋白质序列及结构。原创 2024-06-25 22:40:14 · 422 阅读 · 2 评论 -
BioCLIP 生物界的图文对比模型
参考:CLIP模型引入到生物领域,针对生物分类:界门纲目科属种,进行文本与图像的对比学习训练对其,可以快速对图像进行分类到可能的界门纲目科属种。原创 2024-06-21 23:21:52 · 289 阅读 · 0 评论 -
中文医疗大模型及中文底座大模型参考
参考:https://github.com/HqWu-HITCS/Awesome-Chinese-LLM。原创 2024-04-23 10:04:21 · 248 阅读 · 0 评论 -
生物医药相关大模型:BioMedLM、Mixtral_BioMedical、Med-PaLM2、BioMistral、BioMedGPT、OpenBioLLM
BioMedLM:Med-PaLM:BioMedGPT:主要就是将生物医药相关知识,文本、图像等多模态数据进行构建的行业大模型进行知识问答。原创 2024-04-13 12:20:08 · 835 阅读 · 0 评论 -
LLM生成大模型在生物单细胞single cell的应用:scGPT
训练数据:scGPT全人模型是在3300万个正常人类细胞的scRNA-seq单细胞测向数据上进行预训练的。主要是把单细胞测序出来的基因表达量的拼接起来构建成的序列,这里不是用的基因的ATCG,是直接用的基因名称。输入文本序列就是单细胞测序出来的基因表达量的拼接。原创 2024-04-13 11:40:16 · 323 阅读 · 0 评论 -
LLM生成大模型在生物基因DNA应用:HyenaDNA
不一样的就是𝖧𝗒𝖾𝗇𝖺𝖣𝖭𝖠 block ,主要是GPT的多重自注意力层引入了cnn。整体框架基本就是GPT模型架构。原创 2024-04-13 11:19:27 · 216 阅读 · 0 评论 -
LLM生成大模型在生物基因DNA:DNABERT、DNABERT-2
参考:https://www.youtube.com/watch?v=mk-Se29QPBA&t=1388shttps://github.com/jerryji1993/DNABERThttps://github.com/MAGICS-LAB/DNABERT_23k-mer切分下图:DNABERT-2主要是切次方法的改进向量特征提前:原创 2024-04-13 11:06:35 · 800 阅读 · 0 评论