公众号:【可乐前端】,每天3分钟学习一个优秀的开源项目,分享web面试与实战知识,也有全栈交流学习摸鱼群,期待您的关注!
每天3分钟开源
hi,这里是每天3分钟开源,很高兴又跟大家见面了,今天介绍的开源项目简介如下:
仓库名:
xai-org/grok-1
项目名:
grok-1
开源地址:https://github.com/xai-org/grok-1
主要语言:
Python
stars数量:
43458
forks数量:
7256
开源协议:
Apache License 2.0
一句话介绍
这是一个基于JAX的开源项目,提供了Grok-1开源模型的加载和运行示例。
详细描述
Grok-1 是一个强大的深度学习模型,其架构基于 Mixture of 8 Experts (MoE)
,具有314B的参数。这个模型使用了 SentencePiece
分词器,拥有131,072个词汇。
模型的其他特性包括 Rotary embeddings (RoPE)
、激活分片和8位量化支持。模型的最大序列长度(上下文)为8,192个词汇。
此项目的目标是为了提供一个方便的方式给开发者加载和运行Grok-1模型。
具体功能
- 提供了Grok-1开源模型的加载和运行示例代码。
- 包含了一个可以下载模型权重的链接,使用者可以通过种子客户端或者直接通过HuggingFace🤗 Hub下载。
- 项目中包含了一个运行代码的示例,使用者可以通过示例代码来测试模型。
如何使用
- 首先,你需要下载模型的权重,并将ckpt-0目录放置在checkpoints目录中。你可以通过以下种子链接来下载模型的权重:
或者你也可以直接通过HuggingFace🤗 Hub来下载:magnet:?xt=urn:btih:5f96d43576e3d386c9ba65b883210a393b68210e&tr=https%3A%2F%2Facademictorrents.com%2Fannounce.php&tr=udp%3A%2F%2Ftracker.coppersurfer.tk%3A6969&tr=udp%3A%2F%2Ftracker.opentrackr.org%3A1337%2Fannounce
git clone https://github.com/xai-org/grok-1.git && cd grok-1 pip install huggingface_hub[hf_transfer] huggingface-cli download xai-org/grok-1 --repo-type model --include ckpt-0/* --local-dir checkpoints --local-dir-use-symlinks False
- 接着,你需要安装项目的依赖包,然后运行
run.py
文件来测试代码:pip install -r requirements.txt python run.py
- 注意,由于模型的大尺寸(314B 参数),测试模型的机器需要有足够的 GPU 内存。此仓库中的 MoE 层实现并不高效,这样选择是为了避免使用自定义内核来验证模型的正确性。
以上就是关于 xai-org/grok-1
项目的全面介绍,希望对你有所帮助!如果你对深度学习或者自然语言处理感兴趣,那么这个项目绝对值得一试!
最后
感谢您的阅读,这里每天都会推送优秀的开源项目,如果觉得有帮助的话,一键三连一下吧~