scaled_dot_product_attention demo并且导出为onnx

极乐净土0822

已于 2024-02-03 14:22:21 修改

阅读量985

点赞数 17

文章标签： python pytorch 开发语言

于 2024-01-29 10:26:20 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/love_xunmeng/article/details/135906404

版权

import torch

import torch.nn as nn

import torch.nn.functional as F

import onnxruntime as ort

import numpy as np

def demo_scaled_dot_product_attention():

query = torch.randn(1,16,1,128)

key = torch.randn(1,16,32,128)

value = torch.randn(1,16,32,128)

attention_mask = torch.ones((1,1,32,32), dtype=torch.bool)

attn_output = F.scaled_dot_product_attention(

query, key, value, attn_mask=attention_mask

).transpose(1, 2)

def demo_scaled_dot_product_attention_model():

class MyModel(nn.Module):

def __init__(self):

super(MyModel, self).__init__()

def forward(self, query, key, value, attention_mask):

attn_output = F.scaled_dot_product_attention(

query, key, value, attn_mask=attention_mask

).transpose(1, 2)

return attn_output

model = MyModel()

query = torch.randn(1,16,1,128)

key = torch.randn(1,16,1,128)

value = torch.randn(1,16,1,128)

attention_mask = torch.ones((1,1,1,1), dtype=torch.bool)

torch.onnx.export(model, (query, key, value, attention_mask), "MyModel.onnx", input_names=["query", "key", "value", "attention_mask"], output_names=["output"])

def test_my_model():

session = ort.InferenceSession("MyModel.onnx")

query = np.random.randn(1,16,1,128).astype(np.float32)

key = np.random.randn(1,16,1,128).astype(np.float32)

value = np.random.randn(1,16,1,128).astype(np.float32)

attention_mask = np.ones((1,1,1,1), dtype=np.bool_)

output = session.run(["output"], {"query":query, "key":key, "value":value, "attention_mask":attention_mask})

print(output[0].shape)

def main():

demo_scaled_dot_product_attention()

# demo_scaled_dot_product_attention_model()

# test_my_model()

if __name__ == "__main__":

main()

---------------------------------------------------------

导出onnx如下：

极乐净土0822

关注

17
点赞
踩
23

收藏

觉得还不错? 一键收藏
0
评论
scaled_dot_product_attention demo并且导出为onnx

scaled_dot_product_attention
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。