![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Cutlass
s.feng
计算机视觉,C++
展开
-
cutlass之基础类型
矩阵的layout, 其实就是把coord包装一下,主要看看两者的区别, 其实layout中主要就是包含上面说的一个stride, 也确实,一旦固定是行优先还是列优先后,只要定了stride后就固定了格式。W], 至于为啥是这个顺序我也不知道,估计是约定俗成的。理解步长其实就是在内存中,N0距离N1的长度是C。不是很明白为啥RowMajor是class, 而其他类型是struct?真是让我强迫症犯了。原创 2024-04-07 17:49:39 · 204 阅读 · 0 评论 -
cutlass序言
最近自己的服务器终于搞定了,虽然显卡是3060Ti, 但是基本目前nv主流的库和工具都支持,所以后续开始稳定研究cuda了,nv的库用过很多,目前玩过cub, thrust, cudnn,tensorrt等,但是只有少部分开源,比如cub和cutlass, cub是开源的但是都是一些经典并行算法,自己也移植过一个sort算法收获颇丰, cutlass更多是一些AI相关的算法,为了紧跟大模型时代,所以后面准备做个博客系列来分享学习经历,一方面记录,一方面看看能不能给国产GPU的高性能工程师一点优化参考,毕竟这原创 2024-03-27 14:19:50 · 140 阅读 · 0 评论