ONNX 加速模型推理

1.安装onnx

pip install onnx onnxruntime

2. 加载模型并转存模型为onnx格式,并测试

使用实例为sentence-transformers 预训练模型计算相似度

class Test(object):
    def init(self):
        # 加载预训练模型
        self.tokenizer = AutoTokenizer.from_pretrained("../all-MiniLM-L6-v2")
        self.model = AutoModel.from_pretrained("../all-MiniLM-L6-v2")
        # 模型设置为推理状态
        self.model.eval()
        # 转化成onnx模型
        self.onnxmodel = self.transfer_onnx(self.model)
        
    def transfer_onnx(self, model):
        #随机创建输入数据。因为模型的导出实际上是执行了一次推理过程。在执行的过程中记录使用到的操作。
        # 输入数据可拷贝至gpu,在cpu上直接写None就可
        inputs = {
            'input_ids':
            torch.randint(32, [2, 32], dtype=torch.long).to(
                None),
            'attention_mask':
            torch.ones([2, 32],
                       dtype=torch.long).to(None),
            'token_type_ids':
            torch.ones([2, 32],
                       dtype=torch.long).to(None), 
        }
        # 转换后模型存储地址
        onnx_model_path = "./temp_turbo_onn
  • 3
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 5
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值