性能调优汇总
汇总各性能调优系列的文章说明
USST_Coder
这个作者很懒,什么都没留下…
展开
-
C++性能优化系列——百倍加速比的矩阵转置性能调优
打算写一个矩阵转置分别在CPU和GPU平台的性能优化的系列,在最开始把测试环境等一些基本情况交代清楚。 机器配置 为了方便性能对比,介绍一下我的测试机器配置。 CPU Intel 9900k,程序主要与主频和缓存密切相关,参考如下: 优化情况 CPU平台上对(1024 * 1024)1M大的矩阵转置,执行情况如下: 优化手段 执行时间(ms) 原始 2.68945 写内存连续 1.5498 写内存连续+分块 0.605469 写内存连续+分块+内存填充 0.367188原创 2020-08-08 11:21:55 · 1343 阅读 · 0 评论 -
C++性能优化系列——3D高斯核卷积计算题目
计划写一个优化3D高斯核卷积计算的系列博客。3D高斯核卷积计算的需求来自于公司内部举办的性能优化竞赛,这里介绍题目信息。 题目 题目三3D卷积(相关)操作 (20分) 【场景和性能问题描述】 背景:在图像处理中,卷积(滤波)是一个基本、常用的操作,很多图像处理方法都要用到,但是卷积是非常耗时的操作,尤其是在卷积核比较大、图像比较大(3D)的情况。当前XXX配准35%时间用在高斯卷积上,所以对它进行性能研究有实际价值。 题目:对一个432432457的图像做3D高斯卷积,卷积核大小为313131。 【要求】原创 2020-08-24 15:04:39 · 365 阅读 · 0 评论