![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
cuda
java-melon
写的博客主要对学习的知识点进行记录总结,方便日后查看,也供大家参考,不足之处还请大家指正。
展开
-
求解随机构建大数组的最大最小值
问题描述: #include <stdio.h> #include<iostream> #include <time.h> using namespace std; //求R的模长 float length(float *a) { float sum = 0; for (int i = 0; i < 8192; i++) { sum += a[i] * a[i]; } return sqrt(sum); } //最大值 float qmax(float原创 2020-12-29 11:26:04 · 297 阅读 · 2 评论 -
cpu与gpu实现矩阵相乘对比
1、完成矩阵相乘的并行程序的实现 要求:实现2个矩阵(1024*1024)的相乘。数据类型设置为float。 (1) 使用CPU计算; #include <stdio.h> #include <stdlib.h> #include <time.h> #include <iostream> int main() { //定义矩阵的长度 int Ndim = 1024, Mdim = 1024,Pdim=1024; int szA = Nd原创 2020-12-08 10:41:23 · 1434 阅读 · 1 评论 -
cuda求矩阵每一行最大值
2、完成一个尺寸512*512的二维数组的每一行最大值的并行程序实现数据类型设置为float。需要完成4个版本。 (1) 不使用共享内存,只使用全局内存;采用具有分支发散的并行归约; #include "cuda_runtime.h" #include "device_launch_parameters.h" #include <stdio.h> #include <stdlib.h> #define index 512 # define TILE_WIDTH 2 __global原创 2020-12-08 10:45:19 · 1573 阅读 · 3 评论