自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

yan31415的博客

博客等级

码龄12年

56
原创

148
点赞

617
收藏

109
粉丝

关注

私信

热门文章

分类专栏

性能调优汇总 2篇
C++性能调优 20篇
CUDA性能调优 4篇
Intrinsic 4篇
性能分析工具 6篇
CUDA 14篇
CUDA C编程权威指南 6篇
Cache 6篇
并行化 3篇
C++ 2篇
ML 1篇
汇编 3篇
Linux 4篇

最新评论

C++性能优化系列——矩阵转置(五)Intrinsic函数详解
_胡辣汤_: 这些文档是在哪看到的，能给个地址么？
root用户 ssh远程登录提示access denied
一纸战荒年: 乱说，根本就不行
C++性能优化系列——矩阵转置(二)循环分块优化缓存访问
tooram: 博主你好，代码17行转置逻辑那里是不是应该改成？[code=csharp] pTarget[(irow+ibr*BLOCK) * NROW + ibc*BLOCK+icol] = pSource[(ibc*BLOCK+icol) * NROW + irow+ibr*BLOCK]; [/code]
C++性能优化系列——矩阵转置(二)循环分块优化缓存访问
tooram: 个人调了一下应该是改成pTarget[(irow+ibr*BLOCK) * NROW + ibc*BLOCK+icol] = pSource[(ibc*BLOCK+icol) * NROW + irow+ibr*BLOCK];可能作者有笔误，改完之后优化的效果还是很明显的
root用户 ssh远程登录提示access denied
准了: 改了也没效果的家人看看自己是不是把那行注释掉了。。

Intrinsic

关注

关注数：文章数：4 文章阅读量：8997 文章收藏量：9

作者: USST_Coder

这个作者很懒，什么都没留下…

展开

专栏收录文章