本节开始,进入resnet50 的第 5 部分优化:代码生成,对应的代码目录在 5th_codegen 下。
什么是代码生成
先看个例子,假设要实现如下功能:对两个等长的数组,将第一个数组中数值为偶数的数与第二个数组中对应位置的数相加,得到一个新的数组,其余位置设为0。
正常情况下,可以用 c++ 写出如下代码:
int v1[5] = {1, 2, 4, 5, 6};
int v2[5] = {11, 12, 14, 15, 16};
int res[5] = {0};
for (int i = 0; i < 5; i++) {
if (v1[i] % 2 == 0) { // 判断是否是偶数
res[i] = v1[i] + v2[i]; // 如果为偶数则相加
}
}
这样写没问题,但是深入分析就可以看到,数组中 index 为0 和 3 的位置为奇数,只有1,2,4的位置为偶数,相加操作仅计算 index = 1,2,4 的位置即可。
如果有一种办法,可以事先知道数组中需要计算的下标索引 index,那么就可以写出如下代码:
int v1[5] = {1, 2, 4, 5, 6};
int v2[5] = {11, 12, 14, 15, 16};
int res[5] = {0};
res[1] = v1[1] + v2[1];
res[2] = v1[2] + v2[2];
res[4] = v1[4] + v2[4];
这种写法和上面的写法区别在于:
本文探讨了代码生成的概念和优势,通过一个简单的数组计算示例,展示如何避免循环和判断逻辑,提升代码执行效率。在resnet50优化项目中,采用预先运行原始逻辑生成代码的方法,减少了不必要的计算步骤,生成的代码可以编译为库或可执行文件,为大规模数据处理和复杂计算逻辑带来性能提升。
订阅专栏 解锁全文
3638

被折叠的 条评论
为什么被折叠?



