setuptools编译cuda扩展

# 我需要在python端调用c++ cuda接口,使用pybind11 实现
# cuda 接口需要图像宽度,高度和numpy array的图像数据作为参数, 返回numpy array 类型, 定义接口如下:
py::array_t<unsigned int> faster_label(size_t image_width, size_t image_height, py::array_t<unsigned char>& input_image);

# 该接口在binding.cu 里面这是一个cuda文件
# binding.cu 完整定义如下:


#include <iostream>
#include <vector>
#include "timer.h"
#include "CCL.cuh"
#include "utils.hpp"
#include <pybind11/pybind11.h>
#include<pybind11/numpy.h>
#include <pybind11/stl.h>
namespace py = pybind11;
using namespace std;


void checkCudaErrors(cudaError_t result) {
    if (result != cudaSuccess) {
        cerr << "CUDA Runtime Error: " << cudaGetErrorString(result) << endl;
        exit(EXIT_FAILURE);
    }
}

py::array_t<unsigned int> faster_label(size_t image_width, size_t image_height, py::array_t<unsigned char>& input_image) {
    auto buf = input_image.request();
    unsigned char* image_data = static_cast<unsigned char*>(buf.ptr);
    size_t numPixels, numRows, numCols;
    numCols = image_width;
    numRows = image_height;
    numPixels = numRows*numCols;
    // Allocate GPU data
    unsigned  int* device_labels;
    cudaMallocManaged(&device_labels, numPixels * sizeof(int));
    checkCudaErrors(cudaGetLastError());
    // Allocate and copy the original image data to GPU memory
    unsigned char* gpu_image;
    cudaMallocManaged(&gpu_image, numPixels * sizeof(char));
    checkCudaErrors(cudaGetLastError());
    cudaMemcpy(gpu_image, image_data, numPixels * sizeof(char), cudaMemcpyHostToDevice);
    checkCudaErrors(cudaGetLastError());
    GpuTimer timer;
    timer.Start();
    connectedComponentLabeling(device_labels, gpu_image, numCols, numRows);
    cudaDeviceSynchronize();
    unsigned int* label;
    label = new unsigned int[numPixels];
    cudaMemcpy(label,  device_labels, numPixels * sizeof(int), cudaMemcpyDeviceToHost);
    py::array_t<unsigned int> out({image_height, image_width});
    auto out_buf = out.request();
    memcpy(static_cast<unsigned int*>(out_buf.ptr), label, out_buf.size * out_buf.itemsize);
    timer.Stop();
    cout << "GPU code ran in: " << timer.Elapsed() << "ms" << endl;
    unsigned int components = util::countComponents(device_labels, numPixels);
    cout << "Number of components: " << components << endl;
    // Free memory
    cudaFree(gpu_image);
    cudaFree(device_labels);
    return out;
}
void release_mem(const unsigned int* ptr) {
    delete [] ptr;
}

PYBIND11_MODULE(faster_ccl, m) {
    m.doc() = "Example bindings for CUDA CCL";
    m.def("faster_label", &faster_label, "Perform connected component labeling on an image.", py::arg("image_data"), py::arg("image_width"), py::arg("image_height"));
    m.def("release_mem", &release_mem, "Release memory allocated by faster_label.");
}

# 我们使用pybind11 定义了接口以及参数
# 接下来需要定义setup.py 文件定义如何编译cuda扩展

from setuptools import setup
from torch.utils.cpp_extension import BuildExtension, CUDAExtension
ext_modules = [CUDAExtension('faster_ccl', ['binding.cu', 'CCL.cu',])]
setup(
    name='cuda ccl python extension',
    version='0.1',
    author='404NotFound',
    description='A Python extension using PyBind11',
    ext_modules=ext_modules,
    cmdclass={'build_ext': BuildExtension},
    zip_safe=False,
)
![使用 python setup.py build_ext 进行编译](https://i-blog.csdnimg.cn/direct/4d85b9b97a1a4e06b756d966ba2d8247.png#pic_center)

编译成功后生成的pyd 直接import 调用即可
import cv2
from skimage import measure
import faster_ccl
import time
image = cv2.imread('2.png', cv2.IMREAD_GRAYSCALE)
image_h, image_w = image.shape[:2]
label = faster_ccl.faster_label(image_w, image_h, image)
start = time.time()
regions = measure.regionprops(label)
for (j, i) in enumerate(regions):
    (min_row, min_col, max_row, max_col) = i.bbox
end = time.time()
cost = end - start
print("cost -------->", cost)

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
资源包主要包含以下内容: ASP项目源码:每个资源包中都包含完整的ASP项目源码,这些源码采用了经典的ASP技术开发,结构清晰、注释详细,帮助用户轻松理解整个项目的逻辑和实现方式。通过这些源码,用户可以学习到ASP的基本语法、服务器端脚本编写方法、数据库操作、用户权限管理等关键技术。 数据库设计文件:为了方便用户更好地理解系统的后台逻辑,每个项目中都附带了完整的数据库设计文件。这些文件通常包括数据库结构图、数据表设计文档,以及示例数据SQL脚本。用户可以通过这些文件快速搭建项目所需的数据库环境,并了解各个数据表之间的关系和作用。 详细的开发文档:每个资源包都附有详细的开发文档,文档内容包括项目背景介绍、功能模块说明、系统流程图、用户界面设计以及关键代码解析等。这些文档为用户提供了深入的学习材料,使得即便是从零开始的开发者也能逐步掌握项目开发的全过程。 项目演示与使用指南:为帮助用户更好地理解和使用这些ASP项目,每个资源包中都包含项目的演示文件和使用指南。演示文件通常以视频或图文形式展示项目的主要功能和操作流程,使用指南则详细说明了如何配置开发环境、部署项目以及常见问题的解决方法。 毕业设计参考:对于正在准备毕业设计的学生来说,这些资源包是绝佳的参考材料。每个项目不仅功能完善、结构清晰,还符合常见的毕业设计要求和标准。通过这些项目,学生可以学习到如何从零开始构建一个完整的Web系统,并积累丰富的项目经验。
资源包主要包含以下内容: ASP项目源码:每个资源包中都包含完整的ASP项目源码,这些源码采用了经典的ASP技术开发,结构清晰、注释详细,帮助用户轻松理解整个项目的逻辑和实现方式。通过这些源码,用户可以学习到ASP的基本语法、服务器端脚本编写方法、数据库操作、用户权限管理等关键技术。 数据库设计文件:为了方便用户更好地理解系统的后台逻辑,每个项目中都附带了完整的数据库设计文件。这些文件通常包括数据库结构图、数据表设计文档,以及示例数据SQL脚本。用户可以通过这些文件快速搭建项目所需的数据库环境,并了解各个数据表之间的关系和作用。 详细的开发文档:每个资源包都附有详细的开发文档,文档内容包括项目背景介绍、功能模块说明、系统流程图、用户界面设计以及关键代码解析等。这些文档为用户提供了深入的学习材料,使得即便是从零开始的开发者也能逐步掌握项目开发的全过程。 项目演示与使用指南:为帮助用户更好地理解和使用这些ASP项目,每个资源包中都包含项目的演示文件和使用指南。演示文件通常以视频或图文形式展示项目的主要功能和操作流程,使用指南则详细说明了如何配置开发环境、部署项目以及常见问题的解决方法。 毕业设计参考:对于正在准备毕业设计的学生来说,这些资源包是绝佳的参考材料。每个项目不仅功能完善、结构清晰,还符合常见的毕业设计要求和标准。通过这些项目,学生可以学习到如何从零开始构建一个完整的Web系统,并积累丰富的项目经验。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值