【Deepseek】激活参数的一些研究和理解

在这里插入图片描述

DeepSeek-V3重磅发布:性能暴增3倍,价格却只有其他大模型的1/5!深度解析与实测

激活参数(Activated Parameters)

激活参数是指在模型训练或推理过程中实际参与计算的参数数量。它是衡量模型实际计算资源需求的重要指标。

激活参数与总参数

以 DeepSeek-V3 为例:

  • 激活参数:37B(370亿参数)
  • 总参数:671B(6710亿参数)

DeepSeek-V3 采用 MoE(Mixture of Experts)架构,这使得它能够:

  • 在每次推理时只激活部分专家网络
  • 拥有庞大的总参数量,但保持较低的计
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI新纪元

您的鼓励是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值