异构并行通信
文章平均质量分 89
异构算力老群群
博士在读: 山东大学 (985),
本硕: (双一流)(211)高校,
多年企业级系统开发经验,
研究方向:k8s(main) 安全 异构算力,软件工程,网络安全,物联网,优化算法,区块链;
️获得研究生国家奖学金,第一作者发表中科院SCI一区Top多篇,EI国际会议多篇,总计影响因子80+,单篇影响因子10.6,谷歌学术index引用180+;
欢迎交流科研心得,
I believe 数字未来,数字共享
展开
-
CUDA统一内存:简化GPU编程的内存管理
统一内存是CUDA中一种内存管理机制,它允许开发者在单个内存地址空间中分配内存,这块内存可以被CPU和GPU共同访问。这意味着开发者不再需要显式地在CPU和GPU之间复制数据,系统会根据需要自动将数据在CPU和GPU之间迁移。CUDA统一内存为开发者提供了一种更加简洁、高效的内存管理方式。通过统一内存,开发者可以更加专注于算法的实现和性能优化,而无需过多地关注数据的传输和管理。然而,在使用统一内存时,也需要注意其潜在的性能开销和内存限制。通过合理地使用统一内存,你可以显著提升CUDA应用程序的易用性和性能。原创 2024-09-05 19:41:03 · 604 阅读 · 0 评论 -
一文读懂GPU通信互联技术:GPUDirect、NVLink与RDMA
GPUDirect是NVIDIA开发的一项技术,旨在实现GPU与其他设备(如网络接口卡NIC和存储设备)之间的直接通信和数据传输,而无需CPU的参与。传统上,数据在GPU和另一个设备之间传输时,必须通过CPU,这导致潜在的性能瓶颈和延迟增加。GPUDirect技术则通过绕过CPU,直接访问和传输数据,显著提高系统性能。NVLink是NVIDIA开发的一种高速、高带宽的互连技术,用于连接多个GPU之间或GPU与其他设备(如CPU、内存等)之间的通信。原创 2024-08-13 14:37:36 · 1471 阅读 · 0 评论