自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 【娱乐项】看人工智能如何狡辩-问大模型是否有自由意志

本文由人工智能生成

2024-05-17 10:42:46 135

原创 【生信工具总结】分泌基因簇分析给力工具的安装与使用-Antismash

antiSMASH使用手动编纂并验证过的“规则”,这些规则定义了哪些核心生物合成功能需要在一个基因组区域中存在才能构成一个生物合成基因簇(BGC)。这些规则基于对已知生物合成途径的理解,包括识别负责关键合成步骤的酶编码基因等。

2024-05-16 15:19:31 1250 1

原创 生物大模型文献及代码精读(三)找到所有物种的通用基因?

做了什么?在这里我们介绍SATURN(翻译为土星),一种基于蛋白质语言模型的通用细胞嵌入编码基因的学习方法。通过整合来自不同物种的数据集及基因组相似性,作者提出了一种Macrogenes,用于综合不同基因跨物种共表达;作者基于这种embedding方法,将其用于单细胞多物种整合等下游任务,效果拔群;同时还展现了识别位置基因的功能的作用。意义是什么?解决跨物种分析难题增强对细胞类型的理解:SATURN方法通过整合不同物种的单细胞RNA测序数据,揭示了细胞类型在进化过程中的保守性和多样性。

2024-05-09 22:31:43 427 1

原创 由于linux内核升级导致:NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver及启动时修改内核方法

如果你和我一样惨,不小心把gurb文件哪里弄错了,比如说GRUB_DEFAULT=2并且也update了,恭喜你,你的ubuntu系统起不来了... 这个时候,因为你的系统不知道选择哪个内核,所以ubuntu没法运行起来,需要你通过手动告诉他使用哪个内核。跑了一段实验,发现cuda不能用了,第一反应是检查水冷怎么样,结果发现并没有问题,后来通过百度发现是linux内核升级导致的,通过这篇博客提供的方法。同时也可以用这种手动选内核的方法来测试哪个是和你nvida驱动适配的内核,希望大家一遍就搞定。

2024-04-18 15:49:29 398 1

原创 生物大模型文献精读(二)GenSLMs大模型探索SARS病毒的遗传变异

背景是什么RNA病毒(如SARS-CoV-2)在宿主感染期间高频率突变和快速适应的能力。监测和解析这些变异对于追踪疫情传播、评估病毒传染性、致病性及免疫逃逸能力至关重要。做了什么?GenSLMs通过预训练于超过1.1亿个原核生物基因序列,并针对150万个SARS-CoV-2基因组进行精细调整,展现出能够快速、准确识别关注变异株(Variants of Concern, VoCs)的能力。意义是什么?这种模型具有泛化能力,有望应用于其他预测任务,标志着在病毒新变种识别与分类方法上的革新。

2024-04-09 21:47:02 804

原创 彻底疯狂!实操用Golare在单块4090上预训练大模型及实测效率

最近正想着微调scGPT这种生物大模型,把那篇文章的小部分结果复现一下,结果24G显存还没推理就帕的一下装满了,看着手里的双4090只能本地部署部署的14B,微调微调还要并行运行,可怜的不要不要的,早知道多整几块2080Ti魔改了。詹姆斯表示2080 22g是一张极为......正当我纳闷的时候,想着有没有刚好4090就能跑下的模型,不浪费一点内存。

2024-03-21 23:29:25 1539 1

原创 【数学建模方法及python实现】灰色关联

而且他每天趁你睡觉的时候精神抖擞学习,这个时候,你以为你对他的学习成绩的认知变成了白色系统,但是阻止他行为后,他仍然成绩很好。讲到这里我们发现,实际上人类对世界上大多数的东西都是一知半解的,人类的感官是有限制的,所以看到听到闻到摸到的东西都只是它们信息的一部分,还不包括很多学科没有对它们进行研究,也有很多的未知规律我们没有关注,无视数据量大小,数据分布,灰色关联分析对样本量的多少和样本有无规律都同样适用,而且计算量小,十分方便,更不会出现量化结果与定性分析结果不符的情况。

2024-03-16 18:35:53 1138 1

原创 真核细胞中的病毒基因——内源性逆转录病毒 生信工具总结 祖先留下的血源诅咒?

ERV原病毒两侧有两个长末端重复序列(LTRs),提供调控功能,包括启动子、增强子或引物结合位点,LTR内部由编码基因gag、pro、pol和env组成。ERV原病毒的重组会在整合位置残留一个LTR,因此大多数元件以单独的LTR存在,而在我们的基因组中保持完整的全长ERV大约有4000个。前病毒的结构,其内部区域(红线)编码gag、pol和env基因,两侧为两个长末端重复序列(LTR)。异位重组发生在前病毒的两个LTR之间,导致内部区域连同一个LTR一起缺失,从而形成单个LTR。

2024-03-11 13:47:53 1214

原创 开源GPT?nanoGPT啃代码记实(三)核心BLOCK模块和GPT模块

项目github:https://link.zhihu.com/?今天继续来啃nanoGPT的代码,这个专栏的代码解析讲究一个从0开始,以完全不懂的身份0基础讲解,同时附上扒代码时候的个人理解。

2024-03-10 16:13:16 992

原创 开源GPT?nanoGPT啃代码记实一。(内附nanoGPT续写的抽象派龙族)

今天给大家带来的项目是nanoGPT模型,由特斯拉前AI总监Andrej Karpathy发布,这次的nanoGPT,是他2年前MinGPT的升级版,虽然不如chatGPT的飞机大炮,但是够我们菜🐔扒扒代码了。附上大佬亲自讲解该模型的视频链接:https://www.bilibili.com/video/BV1CP41147Cw/?既然是玩项目,首先让我们用作者给我们铺好的README过把瘾吧,这里我准备了一个龙族1文本准备给nanoGPT训练,也准备将训练好的AI写作结果寄给老贼看看。

2024-03-06 19:15:53 417

原创 生物大模型文献及代码精读(一)scGPT——3000万细胞的预训练模型?

做了什么?建立了一个基于超过3300万个单细胞数据细胞的生成式预训练transformer,主要同时学习细胞和基因的表达。意义是什么?促进预训练模型在各种不同任务中的应用,如细胞类型注释、基因扰动预测、批次校正和多组学集成等方面,展最终实现“通用预训练,按需微调”。话外:预训练模型到底是什么?自己练了一套花拳绣腿,但是自己修为不够,发挥不了这招式的威力,所以找高手传输内力,使得自己的花拳绣腿也威力强大起来了。

2024-03-06 18:08:27 1226 3

原创 【开源GPT?】nanoGPT啃代码记实(二)

yixi−μiσi2ϵ∗γβyi​σi2​ϵ​xi​−μi​​∗γβ接下来是CausalSelfAttention 类就是大名鼎鼎的注意力机制模块了else:return y观察者我 Q,图片 K,观察重点 V所谓1000个人有1000个哈姆雷特,每个眼中的图片都不一样,我们对图片的不同区域的关注是不一样的,这也是图上热图所显示的。

2024-03-04 19:12:06 998

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除