sample等价是什么错误_SOSP '19:TASO - 计算图在特定体系结构/框架上,最优的等价变换...

最近看了 @徐啸 写的论文解读,通俗易懂的文风让人印象深刻,我也打算写两篇。力争于文有据,简洁明快。

这个系列的论文解读

  • 力求精简,我不想做翻译。
  • 会在每个关键词后标明序号(如 [6]),可在本文 有据 一节中,按序号查看出处,方便读者回原文定位。

文章标题:TASO: optimizing deep learning computation with automatic generation of graph substitutions

文章出处:SOSP '19/Stanford University

文章地址:https://cs.stanford.edu/~matei/papers/2019/sosp_taso.pdf

前排广告,欢迎订阅专栏

SysML​zhuanlan.zhihu.com
c3a8b6e08ed276630e7b966a856806f6.png

解决的问题

深度学习框架可以通过对计算图进行等价变换来减少运算时间。本文想自动寻找在特定体系结构&特定框架上,最优的等价变换。

下面进一步解释这个问题。

定义 1:等价变换

图1,这个变换改变了 转置操作 的位置,左右两图结果依然相等。但在特定计算机体系结构、特定框架下,两图性能可能不相等。如果用户描述了其中一种,就可以用速度更快的那一种替代。

aa469faba999f2470001c4faddb67d4e.png
图1:转置上浮/下沉

又如 图2,将小矩阵拼凑成大矩阵进行运算,也是等价变换的一种,也可能存在性能差异。

82917ac039aec577aaa12776fe0b045b.png
图2:小矩阵拼凑大矩阵

问题 1:目前框架中的“等价变换”为手工定义

目前主流框架(TensorFlow, PyTorch, TensorRT, TVM)的等价变换规则,都是依照过去的优化经验,手工定义的。

手工定义扩展性差 [3],易出错 [4]。

问题 1.1:手工定义扩展性差 [3]

扩展性分为两种

  • 加入一个新操作(如卷积操作的变种ÿ
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值