绝影多芯体验,承载 AI 算法新变革

4 篇文章 0 订阅
2 篇文章 0 订阅

随着智能驾驶,大模型等技术发展,汽车工业迎来了翻天覆地的变革,消费者的驾乘体验达到了前所未有的高度。据统计,目前一辆智能汽车所搭载的代码量已经超过 1 亿行。随着智能驾驶渗透率以及 L2、L3 等级别的提升,汽车搭载的代码量将成指数级别增长,对车载算力的需求将迅速增大。然而汽车车载硬件、系统种类繁多,各种加速芯片层出不穷,其他行业和开源的框架工具很难完全支持和适配,难以满足汽车智能化对车载算力的需求。

为满足高算力需求,车载计算平台应运而生,完成感知环节的识别融合任务以及整个决策环节。自动驾驶几乎所有的计算都集中在计算平台。

多操作系统并行部署成主流趋势,面临多种挑战

作为车载计算平台的核心技术「AI 部署」,指在车载协同芯片上部署一个或者多个不同的操作系统,实现高效计算。

目前常见的部署方案有:

  1. 单一操作系统部署:在某些车载芯片应用中,可能只需要一个操作系统来运行所有的应用程序。这种部署方案简单直接,易于管理和维护。

      常见的单一操作系统包括:

    1. Linux:Linux 在嵌入式系统中广泛应用,具有良好的稳定性和可靠性,可以满足大多数车载应用的需求。

    2. RTOS(实时操作系统):针对实时性要求高的应用及 ECU 硬件,RTOS(如 FreeRTOS、RThread 等)可能是更合适的选择。

  2. 多操作系统并行部署:对于复杂的车载芯片应用,需要同时运行多个不同的操作系统来支持不同的功能和应用程序。常见的多操作系统并行部署方案主要采用虚拟化技术。虚拟化是通过某种方式隐藏底层物理硬件的过程,从而实现多个操作系统可以透明地使用和共享硬件。

受益于硬件技术的快速发展,以及物联网智能化、功能安全与信息安全的需求推动,全部由单一操作系统承载所有功能所面临的风险越来越大,多操作系统并行部署成众望所归,但其主要面临以下挑战:

  • 高效部署智能汽车需要大量的「跨域」信号传输,实现不同域之间高效、可扩展、实时、安全的通信成为了部署场景的主要难点。

  • 车载应用算力冲突:在车载芯片中,可能存在不同应用程序之间的算力冲突,例如:多个应用程序同时竞争 CPU 资源,对于资源调度、策略管理、优化算法和任务调度都是一大挑战。

  • SoC 芯片内存成本高昂:车载芯片中常使用的 SoC(System-on-Chip)芯片和内存成本较高,可能会增加产品的制造成本和运行成本。

绝影 ADNN 芯片异构计算平台

基于此我们研发了绝影 ADNN,旨在为行业 AI 算法的芯片部署提供有效解决方案:ADNN 具有协同多种芯片(CPU、GPU、NPU、DSP 等)之间的异构计算能力, 是当前车载行业最广泛的高性能 AI 芯片异构计算平台

ADNN 的特点主要包括以下几个方面:

  1. 协同多种芯片的异构计算:

  • 芯片种类覆盖广ADNN 平台针对海外和国内主流行业座舱 SOC 提供统一的部署平台,简化了开发人员的部署流程,提高了开发效率,同时也降低了应用在不同硬件平台上的兼容性和适配性问题,为车载 AI 算法的开发和应用提供便利。

  • 灵活可扩展:ADNN 的异构计算能力使得车载系统可以灵活地利用多种不同类型的计算资源,根据具体的计算需求动态分配和调度资源,从而实现更好的灵活性和可扩展性。

  1. 高性能,满足车载 AI 应用需求

  • 搭载自研高性能算子库:ADNN 搭载绝影自研 Sense PPL 高性能算子库,其具有 400+ 种算子,涵盖 20 多种主流硬件平台,涵盖了图像处理、数据处理、逻辑运算等多个领域。SensePPL 算子经过优化,能够在硬件上高效运算,无需通过软件模拟,与绝影先进算法进行软硬件-模型协同设计,从而提高计算效率和性能表现,为车载 AI 应用提供了强大的计算支持。

  • 充分利用硬件优势:不同类型的处理器在不同的计算任务上可能具有不同的优势,比如 GPU 适合并行计算,而 NPU 适合神经网络推理加速。ADNN 能够根据任务的特点和硬件的优势进行智能调度,充分利用各种计算资源的特点,提高系统整体的性能表现。

  • 加速算法执行速度:通过将计算任务分配给适合的处理器执行,ADNN 可以加速算法的执行速度,提高系统的响应速度和实时性能,更好地满足车载 AI 应用的需求。

  1. 博采众长,应用领域广泛

由于 ADNN 具有灵活的异构计算能力和高性能特点,除了支持车载行业芯片之外,还一定程度服务其他 AI 赛道,同时吸收其他行业领域的经验,更好地提升算法部署性能。

筑基计算底座,攻克部署难点

在进行 AI 部署时,需要考量的因素更为复杂,包括硬件适配、业务协同、异构并行以及在满足产品功能需求下充分发挥算力,实现高效部署。

跨 OS 虚拟化部署,全方位系统部署

ADNN 在支持各种主流车载操作系统上下足了功夫,针对不同的操作系统和虚拟化场景进行了适配和优化,覆盖了汽车产业的各种系统场景,包括一芯多屏的双系统场景、IVI 终端的单系统场景以及嵌入式 ECU 的 RTOS 场景。为了高效地混合部署、通信协作与安全隔离,绝影创新采用多 OS +虚拟化的全方位部署方案。

  •  OS 编译工具链,一条命令完成所有编译

ADNN 提供了一键式编译 CPU/GPU/DSP/NPU 产物的跨平台编译工具链。集成了多种类型的编译器,包括 LLVM、GCC、Clang、MSVC 等,覆盖了40+ Host 端编译形态。在 device 端集成了 Nvidia NVCC、Hexagon LLVM、OpenCL Binary Build 等,实现一条命令完成所有编译的便捷性。

  • 异构通信组件,有效降低 CPU 占用

  1. ADNN 采用异构通信组件,其负责 CPU 与其他硬件的通信控制,聚合信号发送,提前探测应答信号以提升系统性能。在数据面上支持多种内存管理机制,实现零拷贝,提升缓存命中率,有效降低 CPU 占用。

  • 高效部署,最大化利用计算资源

  1. ADNN 具有算子、模型、帧间三种等级的调度机制。算子层面的搜索机制能够选择最快的计算算法和参数。模型层面保证多个线程、核心的并行和负载均衡,任务线程化及计算向量化也促使性能提升。帧间调度确保不同算法交错运行,最大化利用计算资源。三种等级的调度资源相互协作,管理调度资源,提升硬件资源利用率。除此之外,ADNN 会实时检测 memory latency,确保最大化利用内存带宽。

  • 实现跨虚拟机的通信及调度,有效解决冲突与隔离

ADNN 针对双系统资源紧张、易受干扰的特点,支持上下游隔离及校验。虚拟机监视器 Hypervisor 的驱动下层固件建立事件通道、共享内存池、线程池等,实现跨虚拟机的通信和调度,解决不同系统之间的冲突和隔离问题。

解决车载应用算力冲突,带来极致体验

面对智能驾驶发展,所带来的算力攀升,ADNN 内置的占用分析工具以及算力单元分配方案为车载系统提供了重要的性能优化手段,使得用户在打开导航、听音乐等多个 AI 应用时,仍然能够享受丝滑的座舱体验。

占用分析工具能够清晰地监测任何数据层面和控制层面的资源消耗,通过实时监测系统资源的使用情况,可以及时发现和诊断系统中的性能瓶颈和资源消耗过高的问题。同时结合针对性地优化算法、调整任务调度策略等,CPU 占用率得以降低,提高系统的响应速度和稳定性。

同时,ADNN 采用算力单元分配方案,根据不同硬件的特长,设计算特性匹配合适硬件,分配标量、向量、张量计算单元等,分配资源和任务调度,使得各个算力单元的特性和优势得到充分利用,提高系统的计算效率和性能表现。

最终在 ADNN 加持下,AI 应用的 CPU 占用率能够达到 5 %。

解决 SOC 芯片及内存成本高昂,帮助压缩控制成本

成本问题是部署硬件的重要因素,AI 部署到硬件的成本将限制用户的业务承受能力。另外,硬件的功耗也会影响设备的使用时长,因此,对于功耗要求相对较高。

  • 支持低成本、嵌入式端芯片:

    • ADNN 专门支持了无文件系统,运用模型压缩技术,最小化 ROM 空间占用,节省硬件成本。

    • 在低成本、嵌入式端芯片上,ADNN 通过灵活的功耗管理方式,实现了性能和功耗的平衡,确保系统的稳定性和可靠性。

  • 灵活的功耗控制:

    • ADNN 吸纳了手机侧的功耗管理方式,实现了灵活的休眠和唤醒功能,根据应用负载对系统进行功耗控制。这种灵活的功耗控制方式,可以有效地提高系统的能效比,减低系统发热,提升用户体验。

绝影 ADNN 的推出有望为车载行业的 AI 部署提供更加完善和高效的解决方案,助力车载 AI 技术的发展和应用。未来,绝影将持续发力 AI 部署,深度链接智能汽车行业,携手众多车企合作伙伴,共同打造安全、有温度的智能汽车。

  • 21
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值