AI编译器
文章平均质量分 89
早睡的叶子
码农,计算机爱好者。
展开
-
使用docker镜像快速构建TVM
如何使用docker构建TVM开发环境原创 2024-01-07 12:35:28 · 1210 阅读 · 0 评论 -
AI编译器-图常见优化算法-算子融合
通过将多个逐元素运算融合为一个大的逐元素运算,可以减少内存访问和计算的开销,从而提高性能。多个逐元素运算和批归一化融合:将多个逐元素运算和批归一化层融合为一个大的逐元素运算,减少内存访问和计算的开销。多个逐元素运算和全连接层融合:将多个逐元素运算和全连接层融合为一个大的全连接层,减少内存访问和计算的开销。多个逐元素运算和卷积层融合:将多个逐元素运算和卷积层融合为一个大的卷积层,减少内存访问和计算的开销。多个卷积层和逐元素运算融合:将多个卷积层和逐元素运算融合为一个大的卷积层,减少内存访问和计算的开销。原创 2023-04-24 22:51:24 · 2874 阅读 · 0 评论 -
TVM- End-to-End Optimization Stack for Deep Learning
深度学习模型现在可以识别图像、处理自然语言并在具有挑战性的策略游戏中击败人类。现代硬件稳步提升的计算能力在深度学习目前在许多问题领域的普遍性和相关性中发挥了突出作用。许多最流行的深度学习框架,如 TensorFlow、MXNet、Caffe 和 PyTorch,通过将支持集中在一小类服务器级 GPU 设备上来利用现代硬件的力量——这种支持取决于高度工程化的使用和供应商特定的 GPU 库。然而,专业深度学习加速器的数量和多样性正在迅速增加。原创 2023-04-24 21:57:54 · 550 阅读 · 0 评论 -
TVM: An Automated End-to-End Optimizing Compiler for Deep Learning
TVM论文学习原创 2023-04-24 21:53:51 · 555 阅读 · 0 评论 -
深度学习编译器相关的优秀论文合集-附下载地址
AI编译器论文集合原创 2023-04-11 00:48:38 · 747 阅读 · 0 评论 -
深度学习模型量化学习笔记
深度学习模型量化原创 2022-10-26 22:19:43 · 1069 阅读 · 0 评论 -
Learning to Quantize Deep Networks by Optimizing Quantization Intervals with Task Loss 论文总结
三星量化论文精读原创 2022-10-16 17:15:46 · 1124 阅读 · 0 评论 -
深度学习网络量化白皮书论文学习
卷积神经网络量化相关知识总结原创 2022-10-11 18:19:41 · 1086 阅读 · 0 评论 -
TVM安装编译指南
使用brew安装的llvm地址:/usr/local/Cellar/llvm@9/9.0.1_4/bin/bin/llvm-config开启LLVM#---------------------------------------------# Contrib libraries#---------------------------------------------# Whether to build with BYODT software emulated posit custom d原创 2022-05-17 00:30:31 · 1527 阅读 · 0 评论