cuda
andeyeluguo
这个作者很懒,什么都没留下…
展开
-
转置的好用的cuda程序
通过sample的例子自己改编的一个例子 #include #define BLOCK_DIM 5 // Transpose kernel (see transpose CUDA Sample for details) __global__ void d_transpose(float *odata, float *idata, int width, int height) { __原创 2017-05-25 17:02:17 · 473 阅读 · 0 评论 -
加法
加法代码参考了别人的博客 #include #include //#include "kmeans.h" using namespace std; const int count = 1000; void generate_data(int *arr) { for(int i=0;i<count;i++) {原创 2017-05-10 15:09:34 · 411 阅读 · 0 评论 -
cuda的kernal调用kernal
cuda可以用kernal调用kernal 但是必须在计算能力sm35以上#include #include #include #include // 定义一个 4*4 的矩阵来做 加法和减法 #define WIDTH 4 // 定义 子内核 // 子内核 对 矩阵中的数加 1 __global__ void Child_Kernel ( int * Matrix ) {原创 2018-01-02 19:49:56 · 932 阅读 · 0 评论 -
cuda使用thrust的api求一个向量的最值
懒得自己写了,就使用了thrust的api算了。还挺不错。cuda程序 #include <thrust/extrema.h> #include <thrust/device_ptr.h> #include <iostream> int main(){ float* deviceArray; float max, test; int lengt...原创 2018-04-26 14:52:10 · 1091 阅读 · 0 评论