数值计算
文章平均质量分 56
YoYo鹿鸣_HPC
这个作者很懒,什么都没留下…
展开
-
GPU/DCU减少cudaMemcpy/hipMemcpy时间方案
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档GPU/DCU减少cudaMemcpy/hipMemcpy时间方案前言一、传输延迟测试二、减少传输时间方案1.数据重用2.Pinned Memory3.高维矩阵传输4.传输、计算时间重叠5.批量传输、选择大粒度并行总结前言CUDA是GPU加速器上的编程语言,HIP是DCU加速器上的编程语言,二者生态相似,CUDA可通过hipify工具转换为HIPHIP docs: https://rocmdocs.amd.com/en/late原创 2021-04-02 13:18:46 · 7050 阅读 · 0 评论 -
求解线性方程组的方法总结
求解线性方程组的方法总结高斯消元法的复杂度为 O(n^3)。一般来说,直接法对于阶数比较低的方程组(少于20000至30000个未知数)比较有效;而后者对于比较大的方程组更有效。在实际计算中,几十万甚至几百万个未知数的方程组并不少见。在这些情况下,迭代法有无可比拟的优势。另外,使用迭代法可以根据不同的精度要求选择终止时间,因此比较灵活。...原创 2019-08-22 14:50:20 · 3292 阅读 · 0 评论