- 博客(3)
- 收藏
- 关注
原创 在Windows上运行CUDA Library Example 稀疏矩阵程序
最近研究Tensor Core结构化稀疏矩阵操作,跑一跑NVIDIA的程序。遇到一些Windows上编译链接的问题,查阅资料,收获了一些关于链接的常识。
2023-12-25 18:58:38 416
原创 【阅读笔记】领域专用架构01
现成的编程语言编写领域专用程序(修改底层的编译器工具链等,而不要让普通用户去改自己的代码。3. 用针对特定领域最简单的并行方式,这个领域本身合适的粒度,例如,如果能用SIMD的模式,会比MIMD的并行模式更简单。1. 未来的计算结构会是异构化的,一个标准的CPU运行传统的操作系统,伴随做特定任务的领域专用处理器。特定领域的问题的访存特性容易预测,可以用软件搬运。2. 把资源放在更多运算单元和更多的内存上,而不是进行微结构的优化(例如乱序执行等)。领域专用的人知道此特定领域如何搬运内存。得到了一些idea。
2023-06-26 15:36:09 96 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人