自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(524)
  • 资源 (28)
  • 收藏
  • 关注

原创 C++/ cuda kernel中的模版元编程识别 kernel 模版的数据类型

模板元编程是一种利用 C++ 模板系统在编译时进行计算和生成代码的技术。其原理基于模板特化、递归、模板参数推导等特性,通过模板实例化和展开,在编译时生成代码,以实现在编译期间进行复杂计算和代码生成的目的。

2024-05-23 15:57:21 280

原创 fortran77 初始化矩阵 打印矩阵 模版 备拷

【代码】fortran77 初始化矩阵 打印矩阵 模版 备拷。

2024-05-21 14:01:40 146

原创 能做infiniband 网络设备的厂家有哪些

1. Mellanox(现在是NVIDIA)

2024-05-19 04:12:41 81

原创 备忘 未初始化变量在不同编译器下的处理方式

4,vc++ 对未初始化变量的使用默认视为非法。3,clang 对未初始化变量赋值0。未初始化 int 和 float。2,gcc 对未初始化变量赋值0。

2024-05-17 01:44:32 94

原创 Latex 算法模版整理

【代码】Latex 算法模版整理。

2024-05-16 17:17:09 167

原创 一个关于计算数学 与 计算理论之间的关系的观点

计算理论中的理论,可能比计算数学的数学理论更基础更抽象更高阶一个层级:

2024-05-16 12:43:12 294

原创 带控制结构的 pascal 程序示例

【代码】带控制结构的 pascal 程序示例。

2024-05-09 11:26:30 189

原创 几个简单的 Pascal 程序示例

');readln(r);s:=pi*r*r;end.

2024-05-09 11:24:03 381

原创 程序员老鸟的 Pascal 语言菜鸟教程 -- 快速体验 Pascal

ubuntu 22.04 直接通过 apt 源安装,此时的版本号为 3.2.2。

2024-05-02 01:29:47 367 3

原创 影响 Makefile 中变量值的方式

当你在命令行中直接为 make 命令指定变量时,这些变量的值具有最高优先级。例如:这里,VAR 的值在子 Makefile 的执行过程中将被设置为 "value",无论子 Makefile 内部如何定义 VAR。子 Makefile 中直接定义的变量(不考虑通过命令行或环境变量传递的情况)。这些定义根据赋值方式(=、:=、?=、+=)有不同的行为。

2024-04-30 18:20:41 625 1

原创 C++ 编译器中对 use after free 的检查示例

意图:检查源代码中是否存在某些地址,在free掉之后还对其进行了访问。

2024-04-21 16:41:46 362

原创 一个 cuda shared library 的通用Makefile

一个 cuda shared library 的通用Makefile。

2024-04-19 18:18:40 217

原创 动态链接库的符号表优化 及 gcc 标志的使用 -MF -MD -MP

Makefile。

2024-04-16 15:00:52 565

原创 #define 和 #include 的工作方式,作用域和穿透力

因为编译和预处理的单位都是一个c语言源文件,先逐条递归刷#include,所以 #define 会随着#include而进入到 c源文件c.c中,然后再从上到下逐条刷#define。b.h 中 #include “a.h”c.h 中 #include "b.h"c.c 中 #include “c.h”那么, c.c 中可以使用宏 M 么?a.h 中 #define M 3。

2024-04-16 12:36:07 308

原创 cmake -S<sourceCodeDir> -B<buildDir> --check-build-system ... 示例与作用

projectx项目的源码文件夹:/home/jim/projectx构建目录为: /home/jim/projectx/build完整示例:cmake -S/home/jim/projectx -B/home/jim/projectx/build --check-build-system CMakeFiles/Makefile.cmake 0cmake:调用CMake命令行工具。-S /home/jim/projectx:使用-S选项指定源目录的路径。这是项目的源代码所在的目录,通常包含一个CMakeL

2024-04-15 14:45:49 506

原创 Mamba 论文翻译

当下,给大多数令人兴奋的深度学习方面的应用赋能的基础模型,几乎普遍是基于Transformer 架构和其核心的注意力模块。很多次二次时间复杂度的架构,例如,那些线性注意力、门控卷积和循环模型,还有结构状态空间模型(SSM),已经被开发用来处理长序列上 Transformer 的计算低效问题,但在处理重要的形态问题上,例如语言处理,这些模型的性能都不如 注意力模型那么优秀。我们找到了这类模型的一个重要的缺陷,它们在基于内容的推理上是很无能的,我们这对于此做了几个改进。

2024-04-15 10:33:13 262

原创 源码安装 clr - hip runtime

git clone --recursive https://github.com/ROCm/HIP.gitcd HIP/git checkout rocm-6.0.2pwdexport HIP_COMMON_DIR=${PWD}cd ../git clone --recursive https://github.com/ROCm-Developer-Tools/clr.gitcd clr/git checkout rocm-6.0.2mkdir build_dcd build_d/cma

2024-04-14 18:04:54 233

原创 教程备忘 一文搞定 cmake 全部技巧之 app 和 lib 的 cmake 系统

文件:hello.cpp add_impl.cpp sub_impl.cpp CMakeLists.txthello.cpp。

2024-04-14 12:58:32 265

原创 mamba 模型对 gpgpu 体系结构提出的新挑战

这个模型虽然还没有跟Transformer 一样大行其道,但做为潜在的竞争者,mamba也表现不俗;虽然深度学习领域不一定会广泛采用mamba架构,但做一个预防性的 gpgpu 架构挑战调研还是有必要。主要回答的问题,当前的 gpgpu 架构是否足以应付 mamba;如果希望做成一些硬件架构上的应对,那么应该对 gpgpu 微架构哪些升级呢。

2024-04-13 15:32:53 332

原创 源码安装 AMD 的 gpu BLAS

安装 ROCm。

2024-04-12 13:25:28 300

原创 can not find libclang_rt.builtins-x86_64.a

make -j35。

2024-04-11 19:00:58 231

原创 warp 上的 Jacobi 旋转法计算 Hermitian 矩阵特征值和特征向量的 cuda 实现

Jacobi旋转的 cuComplex数据类型上的实现。

2024-04-11 12:27:16 194

原创 移植 amd blas 到 cuda 生态

如果是在conda环境中,需要deactive conda 环境;不带Tensile的编译。未完待续... ...

2024-04-11 11:20:02 240

原创 CPU 的 Vector ISA extension 可以充当 CUDA warp 的 VALU 么

2, risc-v 的 vector ISA extension。1, x86_64 的 AVX 指令。3, cuda warp 程序。

2024-04-11 01:08:07 152

原创 cuda / c/c++ 中返回一个浮点数的符号

大于等于0的正浮点数,返回 1.0f;小于0的负浮点数,返回 -1.0f;

2024-04-10 00:37:39 144

原创 AMD Tensile 简介与示例

按照知其然,再知其所以然的认知次序进行。

2024-04-09 01:00:06 510

原创 计算 Hermitian 矩阵的特征值和特征向量 cusolver 示例 DnCheevj

计算Hermitian 矩阵的特征值,使用Jacobi 旋转法,每次调整两个对称元素为0,通过迭代,使得非对角线上的值总体越来越趋近于0.示例扩展了 nv 的 cusolverDsyevj 的示例由于特征向量是正交的,故V*V^c = E,以此作为正确性的验证准则。

2024-04-08 16:14:17 243

原创 可以领课程证书的 open course

可以领 Havard 课程证书的 open course。

2024-04-04 17:04:23 130

原创 LLM 的下一站 Mamba,取代 Transformer,虽然在争议

虽然业界大佬对Mamba有点争议,但是直觉而言,Mamba会取代 Transformer 成为LLM的基础模型算法。

2024-04-03 01:05:45 282

原创 开源 riscv 的一些实现和资料链接

1,hardware design2,an implement3, book4, 蜂鸟开源5,内容比较丰富6,7,design a sim for riscv8,9,collectionwhat?

2024-04-02 01:10:38 734

原创 编译 amd gpu 核心态驱动 rocm kmd linux kernel

AMD 开源了专门的 ROCm 的kmd Linux Kernel,

2024-03-31 19:03:41 484

原创 编译amd 的 amdgpu 编译器

【代码】编译amd 的 amdgpu 编译器。

2024-03-30 21:27:25 433

原创 AMD hipcc 生成各个gpu 微架构汇编语言代码的方法示例

为了简化逻辑,故假设 vector 的 size 与运行配置的thread个熟正好一样多,比如都是512之类的.

2024-03-30 18:24:39 481

原创 一个 hipsolver 特征值示例

先起个头,未完待续....

2024-03-28 00:43:37 278

原创 等待 load data 指令完成的 wait 指令的实现原理

未完待续 ... ...起个头... ...

2024-03-25 11:55:27 235

原创 clang-query 的编译安装与使用示例

作用:检查一个程序源码的抽象语法树,测试 AST 匹配器;帮助检查哪些 AST 节点与指定的 AST 匹配器相匹配;

2024-03-23 19:26:44 348

原创 dlopen dlsym dlerror dlclose 示例

【代码】dlopen dlsym dlerror dlclose 示例。

2024-03-21 14:22:29 189

原创 编译安装 linux 6.6 依赖记录

将 .config 中的如下选项设置为空:

2024-03-19 01:21:56 324

原创 Toy 语言到 LLVM IR 实现源码注释

本运行测试是在llvm-18环境测试,更低的版本也没问题,指示如前所述,更改一句源码为dump()即可。对从程序源代码到AST的转换部分做了注释。

2024-03-13 20:23:03 241

原创 LLVM-3.5 —— 01记,编译 LLVM 3.5.0 clang and clang-query

包括编译:clang clang-tools-extra。

2024-03-11 18:52:58 497

bash-shell matrix-computations llvm-cook loader-linker sparse-ma

bash_shell matrix_computations llvm_cook loader_linker sparse_matrix block_Jacobi_svd regular_expression

2024-01-23

llvm编译器cookbook 中英 SSAbook

llvm编译器cookbook 中英 SSAbook

2024-01-14

Linux kernel 高并发开发

深入理解并行编程V2.0 中英文,示例源码网址: example source code: https://github.com/paulmckrcu/perfbook/tree/master

2024-01-14

mpi学习教程等-都志辉-配合下文https环境搭建

使用openmpi搭建mpi环境 https://blog.csdn.net/eloudy/article/details/135293911 另含: 链接器与加载器 gpu优化

2023-12-29

实分析 I II 英文版 可结合中文纸质书一起阅读

实分析 I II 英文版 可结合中文纸质书一起阅读

2023-10-20

代数多重网格理论资料 AMG AMGX原理

代数多重网格理论与算法and its application AMG AMGX 多份中英文资料,全面系统地说明了 多重网格算法的原理和历史脉络等

2023-09-28

opencl 学习资源pdf and source code

opencl programming guide opencl programming by example and source code opencl 2.1 spec

2023-05-22

常用数值算法集C语言与 Numerical Methods Using Matlab 4th Ed Mathews

常用数值算法集C语言 源程序源码 与 Numerical Methods Using Matlab 4th Ed Mathews pdf英文版

2023-04-12

Realistic Ray tracing pdf and source codes

Realistic Ray tracing pdf and source codes

2022-09-17

比利时的 鲁汶大学 计算机系教授 Philip Dutré 的全局光照教程,和他与合作者在 2002年 SIGGRAPH ppt

比利时的 鲁汶大学 计算机系教授 Philip Dutré 的全局光照教程,和他与合作者在 2002年 SIGGRAPH ppt

2022-09-17

RoofLine 理论的出处、起因、理论和示例

RoofLine 理论的出处、起因、理论和示例

2022-05-09

LLVM IR MLIR: Scaling Compiler Infrastructure for Domain Specifi

LLVM Language Reference Manual 即 LLVM IR MLIR: Scaling Compiler Infrastructure for Domain Specifi

2022-05-06

SSA_LLVMCookBook_DirectMethodSparseLinearSystem

static single assignment book, LLVM Cook book, Direct method sparse linear system solver suite sparse theory

2022-05-05

并行计算稀疏线性系统求解

并行计算稀疏线性系统求解

2022-03-07

x264-164.tar.gz

x264 c语言源代码

2022-01-02

pexports-0.44.tar.gz

dll -> lib

2022-01-02

cuda_matrix_inverse.7z

计算逆矩阵并且验证计算结果,用cuda实现

2021-12-18

llvm_cookb_LLVM_IR骨架语法领进门资料.7z

llvm cook学习资料——LLVM IR语言核心概念入门 核心内容汇总,基本应用命令入门,先用再分析,然后才能进一步结合编译原理看llvm编译器clang的实现代码。

2021-04-25

automata theory language.7z

automata理论资料,内容详实,解决了编程语言的设计,编译器的开发,自然语言语言翻译理论,习题链接,

2021-04-24

带几何解释的线性代数讲义

带几何解释的线性代数讲义,讲解了解析几何以及线性代数工具下的几何定义,几何意义扩展线索下的代数定义,Euclidean Space,酉空间定义,正定矩阵的定义

2020-12-02

英中双语版_flex与bison_pdf.7z

Flex and bison are tools designed for writers of compilers and interpreters, although they are also useful for many applications that will interest noncompiler writers. Any application that looks for patterns in its input or has an input or command language is a good candidate for flex and bison.

2020-11-03

FIRRTL_spec_2020Oct_EditionPDF.7z

The ideas for FIRRTL (Flexible Intermediate Representation for RTL) originated from work on Chisel, a hardware description language (HDL) embedded in Scala used for writing highly-parameterized circuit design generators.

2020-10-19

chisel官方教程20201010版本.7z

资源许可证允许自由传播、修改,甚至是商业用途。 许可证网址: https://creativecommons.org/licenses/by-sa/4.0/ Share — copy and redistribute the material in any medium or format 因此可以放心自由使用

2020-10-11

Digital Design With Chisel_20201010edition.7z

资源许可证书:可以自由传播、改变、甚至是商业用途。 https://creativecommons.org/licenses/by-sa/4. Attribution-ShareAlike 4.0 International (CC BY-SA 4.0) This is a human-readable summary of (and not a substitute for) the license. Disclaimer. You are free to: Share — copy and redistribute the material in any medium or format

2020-10-11

Downloads.zip

B3 和 B4 两个版本 WISHBONE System-on-Chip (SoC)Interconnection Architecturefor Portable IP Cores Brought to You By OpenCores

2020-07-21

Downloads.7z

SystemC from the Ground up (2nd edition) pdf and examples source code

2020-07-18

bootia32.efi

ubuntu遇到32位EFI UEFI。如果安装ubuntu时提醒找不到bootia32.efi,那么将此文件放入U盘的/EFI/BOOT/中。会发现其中只有**64.efi

2018-04-07

CImg 2.0.5_pre092517

cimg.h 这个头文件在里面,以前对这个lib不熟悉,由于CGAL的原因才用到的。

2017-09-28

libQGLViewer-2.6.3.zip

这个版本有些难找,所以挂在这里。请先尝试网络下载。用于cgal开发所用,其他版本的没有编译通过。cgal

2017-09-28

python27_d.lib python27_d.dll python27_d.pdb

从Python2.7.13源码 手工编译的 python27_d.lib python27_d.dll python27_d.pdb,vs2015 win10 64bit,因为vtk支持python的需要。本想免费,但至少要填1分。

2017-09-13

能通过一张照片(2D)得到3D的模型吗

能通过一张照片(2D)得到3D的模型吗

2017-06-30

tbb2017_20170226oss_win.zip

tbb2017年最新版64bit,分数怎么自动跳到了50分了呀,还需要手动改正过来。是为了给其他tbb资源一些机会么?那也挺好的,可以都积累一些分数,方便互相下载

2017-03-22

龙书DirectX9.0\3D游戏开发编程基础 源代码 d3dUtility.cpp

代码是全的,d3dUtility.cpp等全套书的所有c++源码

2016-11-22

NS基础与安装---NS2 是一款开放源代码的网络仿真软件

NS2 是一款开放源代码的网络仿真软件,最初由UC Berkeley 开发而成。他最初为了研 究大规模网络以及当前和未来的网络协议交互行为而开发。它为有线和无线网络上的TCP、 路由和多播等协议的仿真提供了强有力的支持。

2008-11-05

linux动态链接机制研究及应用

linux动态链接机制研究及应用 一篇科技论文,专注与linux内核机制

2008-11-04

这是面向对象数据库科技论文

现在流行的数据库管理系统产品主要都是基于关系模型的。但是,下面这些论文是关于面向对象数据库的。哈哈

2008-10-30

基于OODB技术的GIS空间查询和空间分析模型研究

科技论文,关于面向对象的数据库在地理信息系统中的应用。主要关于数据库技术。

2008-10-30

麒麟使用手册_国产LINUX操作系统

麒麟(kylin)是第一款国产操作系统,这里是它的使用手册内容介绍详尽,200多页的pdf

2007-06-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除