一、函数的细节
cublasIdamax函数的用法
stat = cublasIdamax(handle, n, d_values, 1, max_idx);
//n是数组的个数,d_values是数组,max_idx是返回的最大值序号id+1
if (stat != CUBLAS_STATUS_SUCCESS) printf("Max failedn");
stat = cublasIdamin(handle, n, d_values, 1, min_idx);
if (stat != CUBLAS_STATUS_SUCCESS) printf("min failedn");
二、函数概览
2.1 所有子程序都有四个版本对应的四种数据类型
s, S: float
d, D: double
c, C: cuComplex
z, Z: cuDoubleComplex
2.2 CUBLAS level-1. 标量-向量的基本操作
2.2.1 cublasIsamax, cublasIsamin
此函数查找具有最大/最小幅度的数组元素的最小索引。
2.2.3 cublasSasum
绝对值之和
2.2.5 cublasSaxpy
计算αx + y,向量x乘上标量α加上向量y
2.2.7 cublasScopy
把x拷贝到y上,向量操作。
2.2.9 cublasSdot
点积: 计算向量 x 和 y 的点积
2.2.11 cublasSnrm2
计算向量x的欧几里得范数:
2.2.13 cublasSrot
apply the Givens rotation
2.2.19 cublasSscal
缩放向量:
2.2.21 cublasSswap
交换两个向量:
2.3 CUBLAS Level-2. 矩阵-向量操作
2.3.1 cublasSgbmv
This function performs the banded matrix-vector multiplication:
y=α op(A)x+βy
2.3.3 cublasSgemv
矩阵-向量乘法:
y=α op(A)x+βy
2.3.5 cublasSger
rank-1 update: 列向量和行向量相乘得到矩阵,然后加上一个矩阵:
x和y都是向量,α是标量
2.3.7 cublasSsbmv
对称带状矩阵-向量乘法:
y=α Ax+By
A是对称带状矩阵,x和y是向量,
2.3.9 cublasSspmv
对称压缩矩阵-向量乘法:
y=α Ax+By
2.3.11 cublasSspr
对称压缩矩阵rank-1:
2.3.13 cublasSspr2
对称压缩矩阵rank-2:
2.3.15 cublasSsymv
对称矩阵向量乘法:
2.3.17 cublasSsyr
对称矩阵rank-1:
2.3.19 cublasSsyr2
对称矩阵rank-2:
2.3.21 cublasStbmv
三角带状矩阵-向量乘法:
2.3.23 cublasStbsv
求解三角带状线性系统:
2.3.25 cublasStpmv
三角压缩矩阵-向量乘法:
2.3.27 cublasStpsv
求解三角压缩矩阵:
2.3.29 cublasStrmv
三角矩阵-向量乘法:
2.3.31 cublasStrsv
求解三角矩阵-向量:
2.3.33 cublasChemv
Hermitian 矩阵-向量乘法:
2.3.35 cublasChbmv
Hermitian 带状矩阵-向量乘法:
y=αAx+βy
2.3.37 cublasChpmv
Hermitian 压缩矩阵-向量乘法:
y=αAx+βy
2.3.39 cublasCher
Hermitian 矩阵rank-1:
2.3.41 cublasCher2
Hermitian 矩阵rank-2:
2.3.43 cublasChpr
压缩Hermitian 矩阵rank-1:
2.3.45 cublasChpr2
压缩Hermitian 矩阵rank-2:
2.4 CUBLAS Level-3. 矩阵-矩阵操作
2.4.1 cublasSgemm
矩阵乘法:
C=αop(A)op(B)+βC
2.4.3 cublasSsymm
对称矩阵-矩阵乘法:
C = α A B + β C
两种情况都可以的
2.4.5 cublasSsyrk
对称rank-k:
2.4.7 cublasSsyr2k
对称rank-2k:
2.4.9 cublasStrmm
三角矩阵-矩阵乘法:
2.4.11 cublasStrsm
求解三角矩阵:
2.4.13 cublasChemm
Hermitian 矩阵-矩阵乘法:
具体函数说明引用renshy5的博客