7年来第一次:PowerVR GPU升级真正全新架构

在加州圣克拉拉举办的年度技术峰会上,Imagination抛出重磅炸弹,宣布了2010年以来的第一个真正 全新GPU架构,代号“Furian”。

七年前的“Rogue”架构是PowerVR GPU第一次采用统一着色器设计,如今已经遍布全球各个领域,PowerVR 6/7/8系列都是基于它衍生来的。

Furian的设计首要目标是改进功耗和性能,具体来说就是每毫瓦性能、每平方毫米性能,号称相比于7XT Plus可提升35%的着色器性能、80%的填充率性能(没说像素还是纹理)、70-90%的综合性能。

7年来第一次:PowerVR GPU升级真正全新架构

  Furian架构总览

Furian架构不是从零开始设计的,而是在Rogue的基础上全面翻新。它还是基于区块延迟渲染(Tile Based Deferred Rendering),但几乎每个模块单元、数据流、整体布局都是新设计的,比如支持多线程多任务数据执行,比如微内核固件控制,比如帧缓冲和几何无损压缩,比如新的安全和虚拟化技术,比如增强的扩展性,这对于未来深挖潜力十分关键。

新架构在最核心的ALU Cluster(算术逻辑单元丛簇)方面大大改进,尤其是在每个单独流水线内将原来成对的MAD ALU换成了一个MAD ALU、一个MUL ALU,前者可做加法和乘法,后者只做乘法。

这样的结构效率更高,也更节能——MAD ALU大得多,也需要更多资源才能喂饱。

同时,新架构将每个丛簇的流水线从16级扩展为32级,可降低控制电路负载,而且整体丛簇少了,纹理单元就可以上去了,每时钟周期的双线性采样翻番到8个。

新架构还支持尚未定案的OpenCL 2.x计算标准,以及全面支持Vulkan、OpenVX。

7年来第一次:PowerVR GPU升级真正全新架构

  ALU丛簇总览

7年来第一次:PowerVR GPU升级真正全新架构

  Furian架构布局变化

7年来第一次:PowerVR GPU升级真正全新架构

  ALU密度和效率改进:流水线翻番

Furian架构是面向未来的,可以满足7nm工艺、VR游戏、4K超高清、120fps高帧率、HDR高动态画面、神经网络等等的需求。

不过,Imagination今天只是宣布了新架构,并没有任何新的产品设计(虽然提到了PowerVR 8XT),具体还要看后续规划,以及芯片厂商的设计。

至于基于新架构的实际产品,差不多得到2019年了。

7年来第一次:PowerVR GPU升级真正全新架构

  Furian新架构来也

7年来第一次:PowerVR GPU升级真正全新架构

  Furian架构要特点

7年来第一次:PowerVR GPU升级真正全新架构

  架构变换努力方向

7年来第一次:PowerVR GPU升级真正全新架构

  PowerVR进化史

7年来第一次:PowerVR GPU升级真正全新架构

  两代架构提升对比

7年来第一次:PowerVR GPU升级真正全新架构

  Furian架构的一些核心特点

7年来第一次:PowerVR GPU升级真正全新架构

  更具灵活性

7年来第一次:PowerVR GPU升级真正全新架构

 

7年来第一次:PowerVR GPU升级真正全新架构

 

7年来第一次:PowerVR GPU升级真正全新架构

 

7年来第一次:PowerVR GPU升级真正全新架构

 

扩展性极强

7年来第一次:PowerVR GPU升级真正全新架构

  GPU计算增强

7年来第一次:PowerVR GPU升级真正全新架构

  单独的固件处理器

7年来第一次:PowerVR GPU升级真正全新架构

  高效率系统集成

7年来第一次:PowerVR GPU升级真正全新架构

  市场方向:下一代自动驾驶、移动、平板、变形产品

7年来第一次:PowerVR GPU升级真正全新架构

  市场方向:下一代VR/AR、AI、神经网络、深度学习

7年来第一次:PowerVR GPU升级真正全新架构

  架构汇总

 


  

本文转自d1net(转载)


  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
有史以来最快最智能的图形架构 下一代图形处理器介绍 A-Series代表了基于分块延迟渲染技术的PowerVR架构的最新进展,其中包括很多方案的改进,使其比上一代的PowerVR设计要快2.5倍。   重新设计的ALU单元 A-Series具有超宽的算术逻辑单元(ALU),与上一代架构相比这种128位宽的设计更加简化使得每个时钟的并行计算性能比上一代架构提升了四倍。编译器优化确保最大利用率,从而使得单位性能显著提高,大大提升了功耗效率。   性能的可扩展性 IMGA-Series的多维性能可扩展性可以满足入门级市场(1PPC)以及云应用的多核解决方案(2TFLOP)的性能需求。由于其分级可扩展架构可以根据性能、面积和功率要求添加额外的可扩展处理单元,从而提升TFLOPS、千兆像素和TOPS等指标参数。   可配置的缓存大小 A-SeriesGPU包含缓存配置选项,这使得器件能够显著减少对GPU的带宽需求,从而提高了产品设计的灵活性,降低系统功耗以及系统开发成本。   HyperLane技术 HyperLane技术提供了单独的硬件控制通道,每个通道在内存中都是互相隔离的,使不同的任务能够提交给GPU从而实现安全的多任务处理。通过动态性能控制GPU可以在多个任务上扩展其性能,执行所有任务,同时最大化GPU利用率。HyperLane技术按照优先级提供通道的动态拆分,例如在使用剩余性能执行AI任务时会优先处理图形并为该应用程序提供所需的性能。HyperLane技术还可以隔离受保护的内容实现权限管理,所有IMGA-Series架构GPU产品即使尺寸最小的也支持8通道功能。   AI协同 AI协同是一个新的功能选项,它使SoC设计者能够利用IMGA-Series系列中令人难以置信的计算性能来加速AI任务。通过AI协同操作GPU提供图形性能的同时,利用空闲资源使可编程AI与确定功能协同工作,高度优化ImaginaTIon的神经网络加速器。AI协同在最小尺寸的芯片上提供可编程的AI功能,而统一的软件技术栈则可以表现出灵活性和出色的性能。   GPU分块热图 新的软件优化工具使开发人员能够快速分析设计框架,从而确定哪些模块的图形输出成本最高,以便它们能够更好的集中精力进行优化,并确保得到最好的结果。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值