CUDA for循环计算递归函数,以勒让德多项式(Legendre polynomial)为例(3)

本文介绍了使用CUDA优化计算勒让德多项式的过程,通过将double类型转换为float类型,速度提升约3倍。同时,通过减少全局内存访问,进一步提升了效率。实验结果显示,在计算1000000个点、100阶的勒让德多项式时,GPU版本相较于CPU版本加速了400倍。在release编译模式下,GPU版本依然保持80倍的速度优势。
摘要由CSDN通过智能技术生成

legendre_p.cu

#include "cuda_runtime.h"
#include <cuda.h>
#include <stdlib.h>
#include <iostream>
#include <sys/time.h>
#include <chrono>

#define M 1000000  // M个点等分[-1, 1] 
#define N 100   // Legendre polynomial的阶数

// https://people.sc.fsu.edu/~jburkardt/cpp_src/legendre_polynomial/legendre_polynomial.cpp
// https://people.sc.fsu.edu/~jburkardt/cpp_src/legendre_polynomial/legendre_polynomial.html
float *p_polynomial_value ( int m, int n, float x[] )
{
  int i;
  int j;
  float *v;

  if ( n < 0 ) return NULL;
  
  v = new float[m*(n+1)];

  for ( i = 0; i < m; i++ ) v[i+0*m] = 1.0f;

  if ( n < 1 ) return v;
  
  for ( i = 0; i < m; i++ ) v[i+1*m] = x[i];
 
  for ( j = 2; j <= n; j++ )
  {
    for ( i = 0; i < m; i++ )
    {
      v[i+j*m] = ( ( float ) ( 2 * j - 1 ) * x[i] * v[i+(j-1)*m]   
          
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值