【pytorch】关于C++和CUDA扩展

最新推荐文章于 2024-06-06 23:54:12 发布

Snape_

最新推荐文章于 2024-06-06 23:54:12 发布

阅读量283

点赞数

分类专栏：源码学习文章标签： pytorch c++ python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Snape_/article/details/123926152

版权

源码学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

pytorch的C++扩展编译器

“‎关于编译器的一个小说明：由于 ABI 版本控制问题，用于构建C++扩展的编译器必须与构建 PyTorch 时使用的编译器 ‎‎ABI 兼容‎‎。在实践中，这意味着您必须在 Linux 上使用 GCC 版本 4.9 及更高版本。对于Ubuntu 16.04和其他更新的Linux发行版，这应该已经是默认编译器了。在 MacOS 上，您必须使用 ‎‎clang‎‎（没有任何 ABI 版本控制问题）。在最坏的情况下，您可以使用编译器从源代码构建PyTorch，然后使用相同的编译器构建扩展。‎” ——pytorch官网

为什么需要自定义C++和CUDA扩展？

“在某些情况下，有进一步改进性能的空间。最明显的原因是PyTorch不了解您正在实现的算法。它只知道您用于编写算法的单个操作。因此，PyTorch必须一个接一个地单独执行您的操作。由于对操作的实现（或内核）的每个单独调用（可能涉及启动 CUDA 内核）都具有一定的开销，因此在许多函数调用中，此开销可能会变得很大。此外，运行我们代码的Python解释器本身可能会减慢我们的程序速度。因此，加快速度的一个明确方法是重写C++（或CUDA）中的部分，并融合特定的操作组。融合意味着将许多函数的实现组合到一个函数中，这可以从更少的内核启动以及我们可以执行的其他优化中受益，从而提高全局数据流的可见性。” ——pytorch官网

具体流程

c++ built “ahead of time”

setup.py里调用setuptools
C++头文件#include <torch/extension.h>
使用pybind11将C++函数或类绑定到Python中
终端运行python setup.py install

C++ built “just in time”

在这里插入图片描述
具体略，提前built比较常见。

CUDA

‎首先编写一个C++文件，定义将从 Python 调用的函数。
并使用 pybind11 将这些函数绑定到 Python
‎‎声明‎‎在 CUDA （）文件中定义的函数
在 CUDA 文件中，编写实际的 CUDA 内核
setup.py集成

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【pytorch】关于C++和CUDA扩展

pytorch的C++扩展编译器
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。