本地丐版运行xAI grok-1的尝试(失败版)

前言

xAI开源了包含3000多亿参数的grok-1,想试试在本地跑。试了半天结果内存不够,结果以失败告终,结论是机器丐不了一点,想要跑起来内存必须要管够,显存应该也是需要的(xAI好像用的8*A100 80G NvLink)。如果内存的话应该可以跑起来?

本地硬件

OS: Ubuntu 20.04 5.15.0-101-generic
CPU: Intel i9 12900K
GPU: NVIDIA GeForce RTX 3090 24GB
Memory: 64GB+300GB SWAP
Storage: 1TB SSD+2TB HDD
NVIDIA Driver: 545.23.06
CUDA: V12.3.52 (cuDNN-linux-x86_64-8.9.7.29-cuda12)

代码和checkpoints

这些都可以在github上找到https://github.com/xai-org/grok-1,然后下载权重文件,大概296GB,我用的磁力链接和qBittorrent下的,然后权重文件夹ckpt-0放到checkpoints目录下。

修改代码

直接跑可能跑不了,需要在run.pyL60修改成自己的显卡数量(see issue)。

运行

bash输入pip install -r requirements.txt,其中,jax的版本最好去掉,因为要和自己的机器环境一致(我重新安装了N卡驱动545.23.06和nvcc 8.9.7.29,jax版本为0.4.25+cuda12.cudnn89-cp310,参考JAX: 库安装和GPU使用,解决不能识别gpu问题
【Jax报错】CUDA backend failed to initialize: Unable to load cuPTI

环境配好之后,使用python run.py运行,期间会在/dev/shm里面拷贝那296G的文件作为共享内存啥的,最好先腾出来空间(/dev/shm 调整大小),而且IO如果差一些可能会像下面这样在Loading checkpoint at ./checkpints/ckpt-0卡很长时间。
在这里插入图片描述
鼠鼠就在这里卡了几个小时,最后还是报内存不够。
在这里插入图片描述
可以看到项目对内存的需求还是很大的,64GB RAM + 300GB SWAP还是不够它耗的。此外,对显存的需求好像不是很大?因为我看显存占用一直是18GB左右,也可能是还没运行到吃显存的那一步。

后面估计显存也会是一个大问题,那么这个尝试就到此为止吧,,

GPU is all you need!!! So is money!!!

(实验室服务器内存大很多但是害怕搞崩了就不试了)

  • 12
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
xai方法是指解释人工智能模型如何进行决策的一种透明化技术。xai代表可解释人工智能(Explainable Artificial Intelligence)。人工智能模型通常是由大量数据训练而成的,而这些模型的决策过程常常被视为黑盒子,难以理解。xai方法的目的就是帮助我们理解和解释人工智能模型的决策过程,使其更加透明和可信赖。 xai方法可以通过多种方式实现。其中,一种常见的方法是生成可解释的决策规则。通过分析和解释模型中的参数、权重和特征,我们可以得出一些可理解和可解释的规则,从而理解模型是如何做出决策的。 另外,xai方法还可以通过可视化技术来实现。通过将模型的输入和输出可视化,我们可以更直观地理解模型的决策过程。例如,我们可以将模型对不同输入的判断结果可视化为热力图或者决策树等形式,从而帮助我们理解模型的思考过程。 xai方法的应用领域非常广泛。在医疗诊断中,如果一个人工智能模型给出了一个疾病的预测结果,我们希望能够知道模型是基于哪些特征做出了预测,以增加结果的可信度。在金融领域,人工智能模型可以用于风险评估和预测,而xai方法可以帮助我们理解模型是如何分析和评估风险的,从而为决策者提供更好的支持。 总的来说,xai方法旨在提高人工智能模型的可解释性和可信度,在许多应用领域中具有重要的意义。通过解释模型的决策过程,我们可以更加理解和信任人工智能模型,从而更好地应用和推广人工智能技术。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

A91A981E

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值