![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
blas
Eloudy
哲学家一般认为经验中的规律性就是事物的本质;
对经验中的规律性,做出进一步的解释,是心灵的一种神秘能力,也可能仅仅是一种错觉;
经验,可以是玩出来的,体力劳动获得的,解了很多数学题后感受到的,编程中累积出来的,与朋友交流迸发出来的,读书得来的...
总之,作为一个个体,多折腾折腾,经验应该会更多吧
展开
-
深度学习的核心理念
深度学习的核心理念原创 2023-03-02 13:46:48 · 221 阅读 · 0 评论 -
redhat 9.1 RHEL 9.1 安装 cuda 12.0
redhat 9.1 安装 cuda 12.0原创 2023-02-25 02:03:51 · 853 阅读 · 0 评论 -
RedHat 支持 个人免费用户的方式是开发者模式
成为redhat的开发者,个人用户免费试用redhat的方式原创 2023-02-23 11:20:39 · 1777 阅读 · 0 评论 -
打印平台指针 size,用于Makefile的shell 判断
Makefile用于查看平台pointer的size原创 2023-02-22 17:54:56 · 126 阅读 · 0 评论 -
注释分析一个cusolver的官方示例:cuSolverDn_LinearSolver
cuSolverDn_LinearSolver 注释原创 2023-02-16 11:12:26 · 566 阅读 · 0 评论 -
magma build system 分析 —— Makefile 篇 02 记
编译 magm原创 2023-02-13 18:46:02 · 195 阅读 · 0 评论 -
magma build system 分析 —— Makefile 篇 01 记
magma的构建系统分析,makefile系统原创 2023-02-13 17:59:43 · 196 阅读 · 0 评论 -
const float * [] no known conversion from ‘float **‘ to ‘const float **‘ for 2nd argument
const float* [] C语言与 C++ 语言的方式不同原创 2023-02-05 01:42:36 · 562 阅读 · 0 评论 -
cublasSgetriBatched的input matrix A 的值,在計算之後是否被改變或叫做污染,答案是No
驗證cublasSgetriBatched函數的收入矩陣A的元素值,是否被改寫或污染;原创 2023-01-27 15:32:45 · 170 阅读 · 0 评论 -
magma 2.x build on ubuntu 源码编译 of magma
build magma 2.x原创 2023-01-25 16:12:27 · 1175 阅读 · 0 评论 -
MatLab 單步調試觀察複矩陣(A+Bi)*(C+Di) = (AC-BD) + i[(A+B)*(C+D) - AC - BD] = (AC-BD) + i(AD + BC)
驗證復矩陣乘法原创 2023-01-18 17:55:20 · 144 阅读 · 0 评论 -
MatLab 隨機生成矩阵 复矩阵 单位下三角实矩阵 单位下三角复矩阵 矩阵求逆 矩阵乘法 matlab代码
matlab 复矩阵求逆原创 2023-01-15 19:11:13 · 504 阅读 · 0 评论 -
部分选主元 LU 分解,CGETRF in lapack 选主元时调用 ICAMAX
lapack中complex cgetrf选主元的方式原创 2023-01-14 18:24:14 · 835 阅读 · 0 评论 -
CPU LU Decompose with pivot column Major matrix
LU decompose with pivot原创 2023-01-08 12:48:28 · 128 阅读 · 0 评论 -
build JAX from source code
战功赫赫的jax原创 2022-12-14 15:41:42 · 121 阅读 · 0 评论 -
python numpy 的输出控制
随心所欲地print显示numpy的ndarray内容原创 2022-12-12 16:43:43 · 975 阅读 · 0 评论 -
于仕琪副教授挖掘的 Makefile 第一课的教学核心小案例
比较好的 Makefile 教学入门小案例,欢迎选用原创 2022-12-03 18:21:33 · 224 阅读 · 0 评论 -
现象:奇偶交换排序示意图,理论没整理
奇偶交换排序示意图原创 2022-12-01 13:34:01 · 199 阅读 · 0 评论 -
xunhuan Jacobi method SVD
单纯的cpp程序 ,svd, 循环Jacobimethod原创 2022-11-30 15:55:24 · 346 阅读 · 0 评论 -
SVD Jacobi method two side cpp code
SVD Jacobi method two side algo cpp原创 2022-11-29 16:27:04 · 189 阅读 · 0 评论 -
SVD Jacobi method two side matlab Octave source code
SVD Jacobi method two side algo原创 2022-11-29 16:26:34 · 411 阅读 · 0 评论 -
cublasCgetrfBatched cublasCgetriBatched sample
cublasCgetrf原创 2022-11-12 22:05:39 · 219 阅读 · 0 评论 -
《矩阵计算》chapter 01 在 Octave 中整理运行示例算法
矩阵计算算法原创 2022-10-31 17:47:34 · 133 阅读 · 0 评论 -
加列法计算lower unit matrix inversion
计算 lower unit matrix inversion原创 2022-09-29 11:04:29 · 149 阅读 · 0 评论 -
CPU 矩阵的 LU分解 without pivot
cpu 实现 of LU facterization of matrix原创 2022-09-13 02:02:20 · 250 阅读 · 0 评论 -
Ubuntu 安装 h5c++ 编译器 编译 sherman-morrison
Sherman-Morisson 公式的应用求逆矩阵原创 2022-06-26 04:34:03 · 581 阅读 · 0 评论 -
ADJUSTMENT OF AN INVERSE MATRIX CORRESPONDING TO A CHANGE IN ONE ELEMENT OF A GIVEN MATRIX SHERMAN翻译
求逆矩阵的一个好方法原创 2022-06-25 23:53:19 · 186 阅读 · 0 评论 -
改写 cublas LU分解为 cublas matinv的示例
将nv官方的LU分解sample 改写成 matinv的sample原创 2022-06-09 14:17:29 · 365 阅读 · 1 评论 -
程序员常用命令集,只收集名字 ^^
$ export PATH=/home/hanmeimei/local/bin:$PATH$ which ls$ file helloworld$ objdump --help$ objdump -h -s -d exit.o$ ldd helloworld$ ulimit -c unlimited$ gcc -o helloworld helloworld.c$ gcc -S helloworld.c -o helloworld.s$ as hello..原创 2022-05-16 15:34:37 · 954 阅读 · 0 评论 -
pip 安装 sklearn or scikit-learn python3
安装 sklearn1. 安装 numpy scipy matplotpip3 install numpy scipy matplotlib -i https://pypi.tuna.tsinghua.edu.cn/simple2. 安装 sklearnpip3 install scikit-learn -i https://pypi.tuna.tsinghua.edu.cn/simple只为当前用户安装:pip3 install --user scikit-learn ...原创 2022-05-10 16:39:17 · 1996 阅读 · 0 评论 -
simplest tensor core gemm sample
code-samples/simpleTensorCoreGEMM.cu at master · NVIDIA-developer-blog/code-samples · GitHubhttps://github.com/NVIDIA-developer-blog/code-samples/blob/master/posts/tensor-cores/simpleTensorCoreGEMM.cu原创 2022-05-04 15:05:34 · 249 阅读 · 0 评论 -
抽象代数与计算数学 牛掰的伽罗华域
伽罗华域(Galois Field)理解、基于伽罗华域的四则运算(附详细python代码)_hustfc的博客-CSDN博客_伽罗华域参考链接:https://blog.csdn.net/luotuo44/article/details/41645597参考链接:https://blog.csdn.net/shelldon/article/details/54729687伽罗华域定义我对伽罗华域的理解就是,给定一个域,比如4位,在4位之内的数字,不管加、减、乘、除,结果都在域里面,不会溢出,并且。运算时..原创 2022-05-04 15:02:00 · 263 阅读 · 0 评论 -
传统程序优化与终身程序优化
传统程序优化示例一,cpu示例:3个方面浅谈程序优化 - 每一个程序员都有一个大梦想当初在学校实验室的时候,常常写一个算法,让程序跑着四处去晃荡一下回来,结果也就出来了。可工作后,算法效率似乎重要多了,毕竟得真枪实弹放到产品中,卖给客户的;很多时候,还要搞到嵌入式设备里实时地跑,这么一来真是压力山大了~~~。这期间,对于程序优化也算略知皮毛https://www.ktanx.com/blog/p/1547传统程序优化示例二,gpu示例:百度安全验证https://baijiahao.baidu.原创 2022-05-04 03:51:24 · 278 阅读 · 0 评论 -
nvprof 性能评估主要指标
nvprof 用于性能评估的三个主要指标:occupancynvprof --metrics achieved_occupancy ./helloCuda.outgld_throughputnvprof --metrics gld_throughput ./helloCuda.outgdl_efficiencynvprof --metrics gld_efficiency ./helloCuda.out____________________________________...原创 2022-03-07 00:26:56 · 944 阅读 · 0 评论 -
valgrind 编译 安装 使用 输出信息解读
step1:$ wget https://sourceware.org/pub/valgrind/valgrind-3.18.1.tar.bz2step2:tar -jxvf valgrind-3.18.1.tar.bz2step3:cd valgrind-3.18.1step4:./configurestep5:make -j32step6:sudo make installstep7:$ g++ -g helloWorld.cpp -o helloWorld $.原创 2022-03-06 16:40:38 · 220 阅读 · 0 评论 -
lda in lapack and cublas
在BLAS-3.10.01 的 sgemm.f 文件中,有如下对LDA的描述:\param[in] A*> \verbatim*> A is REAL array, dimension ( LDA, ka ), where ka is*> k when TRANSA = 'N' or 'n', and is m otherwise.*> Before entry with TRANSA = 'N' o原创 2022-03-05 12:55:40 · 204 阅读 · 0 评论 -
shell bash shell 语法中的字符串拼接 合并
shell中的字符串拼接比较人性化,非常直观.比如要实现在一个变量中存储 "Hello Jim!", 而且可以更换里面的人名 Jim,Hello 和 ! 直接用双引号括起来: "Hello " "!", 人名用变量:name。1. 两个变量可以紧紧挨在一起;2. 变量可以和常量紧紧挨在一起。例1:name1="Jim"name2="Lilei"hi_1="Hello "$name1"!"echo $hi_1例2.hello="Hello "name2="Li..原创 2022-03-03 11:17:21 · 1803 阅读 · 0 评论 -
CMake Tutorial 入门 基础
CMake Tutorial — CMake 3.23.0-rc2 Documentation下面一步一步整理实现一个从0到1,2,3的CMake应用案例,能够最终靠近真实的项目应用:原创 2022-03-03 10:41:07 · 99 阅读 · 0 评论 -
Using Eigen in CUDA kernels
UsingEigenin CUDA kernelsEigen: Using Eigen in CUDA kernelsStaring from CUDA 5.5 andEigen3.3, it is possible to useEigen's matrices, vectors, and arrays for fixed size within CUDA kernels. This is especially useful when working on numerous...原创 2022-03-03 10:16:28 · 359 阅读 · 0 评论 -
C++ 正态分布随机数 平均分布随机数 default_random_engine normal_distribution
#include <iostream>#include <vector>#include <string>#include <random>#include <algorithm>#include <cmath>using namespace std;int main(){ const auto random_seed = 1997; std::default_random_e.原创 2022-02-24 10:19:39 · 887 阅读 · 0 评论