- 博客(1)
- 收藏
- 关注
原创 用ldmatrix与mma指令模拟wgmma指令
英伟达即将发布下一代架构,SM号12.0,以下简称sm120。相比于目前的主流Hopper架构(SM号9.0,简称sm90),很明显的一个改动是TensorCore不再支持warpgroup MMA指令,“退化”到了类似于Ampere架构mma指令。而目前爆火的DeepSeek、特别是其重要的组成部分,其实现与sm90深度绑定。
2025-05-29 12:05:01
958
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人