Grok模型初步评测-部署Grok模型的硬件配置

 结论先放开头

需要在本地部署Grok-1,进行运行推理,需要的配置及预算如下(个人经验,仅供参考)

预算400W

核心硬件包括:3台8U的服务器,单台服务器8张A100或者V100显卡,硬盘容量为4TB 固态硬盘,内存至少512GB,4颗Intel(R) Xeon(R) Silver 4310 CPU,NV-LINK显卡连接器。

本文没有代码,该文根据Rrok模型的公开文档进行一个纸面性能上的推测,给出的结论仅仅是在个人认知的基础上得出的。仅供参考

这次Grok模型的开源是迄今为止最大尺寸的开源模型了,而且权重结构全部开放,老马真的是诚意满满。

话说回来这种尺寸模型的开源和普通用户以及小企业没啥大的关系,毕竟3140亿参数。光模型文件就有200多G了。更别提现有要把这个模型运行起来需要多少张H100了。这些在目前公开的文档都是没有的。如果你对3140亿参数没什么概念,GPT3.5 1750亿,Grok模型的性能至少在参数量这个维度上超越了GPT3.5,从他公布的模型评测跑分上也是一样。不过模型评测分数只能用作参考。因为现在没有条件做实际部署,所以具体的性能差异还是没办法得出结论

这个模型开源后我个人觉得。国内那些大厂门,肯定又有借鉴的东西了。

至于这个模型跑起来需要怎么样的硬件配置呢?我们以chatglm130b开源模型作为基准。然后根据部署该模型需要的配置进行一个大致的推断。

根据已知的信息部署ChatGLM130B模型的需要的8张A100(40GB)或者8张V100(32GB),该信息来自GLM的官方github。

 

Grok是314B的参数规格,是130B的2.5倍这样。所以推测运行314B的应该需要20张A100(40GB)或者20张V100(32GB)。该结论是根据GLM130B的硬件需求作为基准进行测算。

已知一台GPU 8U的服务器可以装8张显卡,你需要3台8U的GPU服务器,以及足够数量的NV-LINK GPU桥接线。

又已知现在A100市场上大概15-20W一张。20张A100光显卡我按15W一张算就需要300W了,3台8U的服务器裸机价格大概在20W左右。所以我个人的估算。如果你们的项目组要部署Grok模型,为了保证模型能顺利部署,大概需要24张A100,包含服务器的价格总计在400W这样。记得要买NV-LINK这个GPU连接器。

关于微调

我想肯定会有人问这个模型的微调需要多少张显卡呢?这个嘛。。。你去他们的Github下提问算了,因为这种尺寸模型的微调和大部分人都没有任何的关系。

  • 7
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
配置OpenGrok JDK,需要按照以下步骤操作: 1. 首先,确保您已经安装了JDK(Java Development Kit)。可以从官方Oracle网站下载适合您操作系统的JDK版本,并按照安装向导执行安装。 2. 下载和安装OpenGrok。可以从OpenGrok的官方网站上获取安装包,解压缩到您选择的目录。确保您的系统具备解压缩文件的权限和存储空间。 3. 配置OpenGrok的环境变量。将OpenGrok的安装目录路径添加到系统的PATH环境变量中。这可以通过操作系统的控制面板或使用命令行界面进行设置。 4. 设置OpenGrok的数据目录。在OpenGrok的安装目录中找到"configuration.xml"文件,并编辑该文件。在该文件中,指定OpenGrok数据目录的路径。确保您选择的目录具备读写权限。 5. 配置OpenGrok的索引源代码。在"configuration.xml"文件中,找到示例配置并根据您的实际情况进行修改。指定需要建立索引的代码目录路径,并设置其它属性,如语言过滤器和排除模式等。 6. 启动OpenGrok服务。打开命令行界面,导航到OpenGrok的安装目录,然后运行命令 "sh ./OpenGrok index" 或 "cmd /c OpenGrok index",这将启动OpenGrok并开始索引指定的代码目录。 7. 打开OpenGrok Web界面。在浏览器中输入OpenGrok的URL地址,通常为http://localhost:8080/source/,然后按回车键。 至此,您已经成功配置了OpenGrok JDK,并可以通过Web界面访问索引的代码。您可以在OpenGrok的Web界面中搜索和浏览您的代码,并享受OpenGrok提供的其他功能。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值