欢迎深入探讨 DeepSeek ,他们在活动上推出了 DeepEP — — 一个用于 MoE(专家混合)模型训练和推理的改变游戏规则的开源 EP 通信库。
目录
2. 使用 NVLink 和 RDMA 实现节点内和节点间支持
深入研究 Deepseek 开源周第一天,探索 FlashMLA,这是他们为 Hopper 开发的高效 MLA 解码内核……
DeepSeek 开源周是什么?它为什么重要?
首先,让我们先来介绍一下背景。人工智能领域的巨头DeepSeek启动了开源周,以展示他们对透明度、协作和创新的承诺。第一天,他们推出了FlashMLA