量化之------算子融合

SetMaker

于 2024-05-16 14:54:01 发布

阅读量352

点赞数 4

文章标签：计算机视觉人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40962125/article/details/138961546

版权

算子融合是优化计算的最好的手段之一

算子融合的一些优点可以是这样的：

1. 减少内存访问:
通过合并操作，可以减少中间结果的内存访问，因为中间结果不再需要被存储和重新加载。
2. 减少数据传输:
减少了从内存到计算单元之间的数据传输，有助于提高带宽利用率。
3. 优化计算:
融合后的算子可能更加符合硬件优化，例如使用更有效的指令集。
4. 灵活性:
融合可以根据具体的硬件和计算需求定制，可以在不同的层级进行，例如在张量操作层面，或是更高层面如卷积或全连接层。

如果真的做算子融合，那这个可能性取决于具体的硬件架构（硬件支持很重要）、编程框架、编译器和具体任务。

下面是一些在深度学习中常见的可以考虑融合的算子：

1. 卷积和激活函数

卷积层后通常会接一个激活函数，如ReLU。这两个算子可以融合在一起，避免额外的内存访问。

output = relu(conv2d(input, weights))

2. 卷积和批量归一化（Batch Normalization）

卷积层后常常接有Batch Normalization层。将这两个层融合可以减少对内存的访问和提高计算效率。

output = batch_norm(conv2d(input, weights))

3. 全连接层和激活函数

类似于卷积层，全连接层后也经常接有激活函数。将这两个算子融合可以减少内存访问。

output = sigmoid(dense(input, weights))

4. RNN的不同部分

RNN包含多个相似和重复的计算步骤。某些步骤可以融合以优化性能。

hidden_state = tanh(weights_x @ input + weights_h @ hidden_state)

5. 点积和加法

实施注意力机制的点积后常常会接一个加法操作。这两个操作可以合并。

attention_weights = softmax(query @ key_transpose / sqrt(d_k) + bias)

6. 归一化和激活函数

归一化层（如Layer Normalization, Batch Normalization等）后通常会接一个激活函数。可以考虑将这两个操作融合。

output = relu(layer_norm(input))

7. Element操作

ElementWise的加法、乘法等。如果一个操作的输出是另一个操作的输入，并且两个操作都是ElementWise的，那么它们可以融合。

output = (input1 * weight) + input2

8. 求和和乘法

在一些操作中，如在计算梯度时，求和和乘法操作可以一起执行。

gradient = sum(dydx) * learning_rate

算子融合需要考虑的一个关键因素是数值稳定性。

在某些情况下，算子融合可能会导致数值精度的损失。此外，还需要考虑硬件和软件的兼容性，因为不是所有的算子组合都能从硬件加速中受益。具体的实现会依赖于使用的深度学习框架和硬件架构。

参考什么是算子融合-怎么搞 - 知乎 (zhihu.com)

关注

4
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
量化之------算子融合

此外，还需要考虑硬件和软件的兼容性，因为不是所有的算子组合都能从硬件加速中受益。具体的实现会依赖于使用的深度学习框架和硬件架构。归一化层（如Layer Normalization, Batch Normalization等）后通常会接一个激活函数。如果一个操作的输出是另一个操作的输入，并且两个操作都是ElementWise的，那么它们可以融合。将这两个层融合可以减少对内存的访问和提高计算效率。这两个算子可以融合在一起，避免额外的内存访问。在一些操作中，如在计算梯度时，求和和乘法操作可以一起执行。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

SetMaker 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。