【深度学习编译器系列】2. 深度学习编译器的通用设计架构

最新推荐文章于 2024-08-05 17:47:00 发布

Elaine_Bao

最新推荐文章于 2024-08-05 17:47:00 发布

阅读量666

点赞数

分类专栏：深度学习框架文章标签：深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/elaine_bao/article/details/129149553

版权

本文探讨了深度学习编译器的通用设计，包括前端的硬件无关优化和后端的硬件相关优化，以及中间表示(IR)的重要角色。深度学习编译器领域的活跃玩家众多，如TVM、TensorFlow XLA等，当前正处百家争鸣阶段。

摘要由CSDN通过智能技术生成

在【深度学习编译器系列】1. 为什么需要深度学习编译器？中我们了解到了为什么需要深度学习编译器，和什么是深度学习编译器，接下来我们把深度学习编译器这个小黑盒打开，看看里面有什么东西。

1. 深度学习编译器的通用设计架构

与传统编译器类似，深度学习编译器也采用分层设计。深度学习编译器主要包括编译器前端和编译器后端两部分。

编译器前端主要执行硬件无关的转换和优化，如算子融合，布局转换，代数化简等。
编译器后端主要执行硬件相关的优化，如内核库调用，自动调优，内存分配等。
DLC Architecture
另外，深度学习编译器还有一个必不可少的部分，在上图中没有显式表示出来的，就是中间表示 (intermediate representation, IR)。
IR贯穿深度学习编译器的整个架构，首先深度学习模型通过high level IR（也称为计算图IR）翻译到编译器的前端，编译器前端基于高阶IR进行一系列优化。然后high level IR再映射到编译器后端的low level IR (operator IR)，编译器后端基于low level IR进行一系列优化、代码生成和编译。

2. 深度学习编译器的入局者

在深度学习编译器的整个软件栈上，目前有非常多的玩家在持续投入。从应用层面来看有很多成熟的深度学习框架，如Tensorflow, Py

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【深度学习编译器系列】2. 深度学习编译器的通用设计架构

深度学习编译器主要包括编译器前端和编译器后端两部分。编译器前端主要执行硬件无关的转换和优化，编译器后端主要执行硬件相关的优化。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。