最近自己的服务器终于搞定了,虽然显卡是3060Ti, 但是基本目前nv主流的库和工具都支持,所以后续开始稳定研究cuda了,nv的库用过很多,目前玩过cub, thrust, cudnn,tensorrt等,但是只有少部分开源,比如cub和cutlass, cub是开源的但是都是一些经典并行算法,自己也移植过一个sort算法收获颇丰, cutlass更多是一些AI相关的算法,为了紧跟大模型时代,所以后面准备做个博客系列来分享学习经历,一方面记录,一方面看看能不能给国产GPU的高性能工程师一点优化参考,毕竟这个库不是所有人都有时间和精力去啃的。
cutlass序言
最新推荐文章于 2024-07-22 09:38:37 发布