部分题目记录
填空题
- 卷积层中,input维度为16322020,filter维度为1283233,stride=2,pad_left = pad_top = 0,pad_right = pad_bottom = 1,output维度为__(维度顺序定义为n * c * h * w)
pytorch中用____函数来构建二维卷积神经网络 - 在智能计算系统的抽象架构中,设备端版卡级的存储资源为__,芯片级的存储资源为__,cluster级的存储资源为__,core级的存储资源为__
简答题
- 简述单核深度学习处理器(DLP)的片内存储,访存行为以及指令解码过程和传统CPU上的区别
- 在大模型系统软件中,稀疏注意力机制和FlashAttention机制能够对大模型进行优化,他们有什么区别和联系
- 胖树(Fat tree)、Dragonfly 和 3D的主要内容和优缺点
最后一道大题
假设DLP芯片中有4个cluster,每个cluster中有4个core,host端启动一个任务类型为UNION1,任务规模为 [4,1,2]的任务,请在下表中填写Kernel程序执行时读取到的并行变量的值
taskId | |
---|---|
taskIdX | |
taskIdY | |
taskIdZ | |
taskDimX | |
taskDimY | |
taskDimZ | |
taskDim | |
coreId | |
coreDim | |
clusterId | |
clusterDim |