Google Workloads for Consumer Devices Mitigating Data Movement Bottlenecks

论文分析了数据移动在消费类设备如智能手机中对能耗和性能的影响,尤其是在Chrome浏览器和TensorFlow Mobile中的作用。通过处理在内存(PIM)中的方法,减少了数据移动,平均降低了55.4%的系统总能量和54.2%的执行时间。论文提出了PIM核心和加速器方案,以优化纹理平铺和量化等关键操作,以提高能效。
摘要由CSDN通过智能技术生成

Google Workloads for Consumer Devices: Mitigating Data Movement Bottlenecks(2018)

1. 摘要:
  • 目前正处于消费类设备数量爆炸增长的时代,包括智能手机,基于网络的计算机和可穿戴设备等。这些设备由于电池和热功耗的限制,能效是首要问题
  • 数据移动是消费设备中总系统能耗和执行时间的主要贡献者。在存储系统和计算单元之间的数据移动所产生的能耗和性能开销明显高于计算成本
  • 论文工作:
    • 全面分析了数据移动对几种广泛应用的谷歌客户(consumer)工作负载的能耗和性能影响:Ghrome网页浏览器, TensorFlow Mobile(客户端的tensorflow), Google的机器学习框架, 视频播放, 视频捕捉(capture)。(每个月都有超过十亿的活跃用户)
    • 论文通过将部分的计算在靠近内存的地方进行,即PIM(processing-in-memory)能够显著的减少这些工作负载中的数据移动
    • 四种工作负载中都包含了简单的原语和函数,对整体的数据移动产生了巨大的影响。对于这些原语和函数,论文采用PIM来实现它们
    • 论文分析表明,将这些原语和函数在由简单核心或者专用加速器组成的PIM逻辑中,可以消除大量的数据移动,并显著减少系统总能量(avg. 55.4%)和执行时间(avg. 54.2%)
2. 介绍:
  • 能耗是消费类设备的首要问题,但是这些设备的性能需求也在每年急剧增长,以支持新兴应用,例如4K视频流和录制,虚拟现实和增强显示等。
  • 消费类设备集成了许多耗电组件,例如CPU,GPU,专用加速器,传感器和高分辨率屏幕。
  • 限制消费类设备性能增长的两个趋势:
    • 锂电池在过去的20年中仅增加了一倍
    • 热功耗已成为严重的性能约束
  • 论文基于全面的工作负载分析发现:在消费类设备的多种能源消耗中(例如,CPU,GPU,专用加速器,内存),主内存系统与计算单元(例如,CPU,GPU,专用加速器)之间的数据移动是系统总能量的主要贡献者
    • 当用户滚动浏览Google Docs网页时,在内存和计算单元之间移动数据会导致系统总能耗的77%
    • <
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值