RISCV处理器对AI加速的支持

KGback

已于 2024-10-30 17:53:23 修改

阅读量1.6k

点赞数 22

分类专栏： # 技术分析报告文章标签：人工智能 RISCV

于 2024-09-17 13:38:14 首次发布

本文链接：https://blog.csdn.net/qq_39815222/article/details/142137167

版权

概述

设计方案

主要有两种设计方案。

RISCV核+ASIC

RISCV核是标准的基于RISCV指令集的CPU设计，ASIC部分通常是基于RISCV自带的向量扩展指令集构建的向量处理器，或是自定义的矩阵计算单元。
根据CPU+AI ASIC部件的接口可以分为紧耦合和松耦合的设计¹。

CPU+AI AISC紧耦合设计

紧耦合设计最大的特征是软件对硬件透明，具体设计时以CPU主干为骨架，将AI计算单元集成在CPU内部，共享PC（程序计数器）、寄存器堆等流水线单元，仅在执行单元部分增加了矩阵或向量单元，适用于低功耗场景

将加速部件作为Core流水线的执行部件，通过自定义的指令来控制部件，这种方式有如下优势：
1）普通指令核自定义指令共享软件栈，软件设计更加简单
2）比较容易升级
3）逻辑设计比AISC IP设计与集成工作量更小
4）通过自定义的设计工具，该设计方案可以减少投入市场时间

通过向量扩展指令加速AI

玄铁C906/908/910/920 向量计算扩展

C908架构图

2022年发布的玄铁C908是一款兼容RISC-V架构的64位高能效处理器，支持同构多核架构，支持多cluster，每个cluster支持1~4个C908核心，User模式支持RV64及RV32模式。采用9级双发按序流水线，典型工作频率＞2GHz，通过指令融合技术进一步提升流水线效率，实现了卓越的能效比。兼容RVA22标准，同时兼容RISC-V最新Vector1.0标准以进一步提升AI算力。

如图为C908的架构图：
在这里插入图片描述

C920架构图

2021年发布的C920MP 是基于 RISC-V 指令架构的 64 位高性能多核心处理器，主要面向对性能要求严格的边缘计算领域，如边缘服务器、边缘计算卡、高端机器视觉、高端视频监控、自动驾驶、移动智能终端、5G 基站等。C920MP 采用同构多核架构，支持 1~4 个 C920 核心可配置。每个 C920 核心采用自主设计的微体系结构，并重点针对性能进行优化，引入 3 译码 8 执行的超标量架构和多通道的数据预取等高性能技术。

如图为C920微体系结构图：
在这里插入图片描述