【VScode推理模型部署】ONNX runtime

Dataloading...

已于 2023-09-05 21:35:12 修改

阅读量502

点赞数

文章标签： vscode c++

于 2023-08-28 16:30:26 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44708254/article/details/132541736

版权

推理模型部署(一)：ONNX runtime 实践

VSCode配置之OnnxRuntime(CPU) && YOLOv7验证

C++ 上用 ONNXruntime 部署自己的模型

简单来说，对于机器学习模型过程可分为训练迭代和部署上线两个方面：

训练迭代，即通过特定的数据集、模型结构、损失函数和评价指标的确定，到模型参数的训练，以尽可能达到SOTA(State of the Art)的结果。
部署上线，即指让训练好的模型在特定环境中运行的过程，更多关注于部署场景、部署方式、吞吐率和延迟。
在实际场景中，深度学习模型通常通过PyTorch、TensorFlow等框架来完成，直接通过这些模型来进行推理效率并不高，特别是对延时要求严格的线上场景。由此，经过工业界和学术界数年的探索，模型部署有了一条流行的流水线：

这一条流水线解决了模型部署中的两大问题：使用对接深度学习框架和推理引擎的中间表示，开发者不必担心如何在新环境中运行各个复杂的框架；通过中间表示的网络结构优化和推理引擎对运算的底层优化，模型的运算效率大幅提升。

接下来，我们将通过一步步的实践来体验模型部署的过程。

1. ONNX 面面观

ONNX （Open Neural Network Exchange）是 Facebook 和微软在2017年共同发布的，用于标准描述计算图的一种格式。ONNX 已经对接了多种深度学习框架(如Tensorflow, PyTorch, Scikit-learn， MXNet等)和多种推理引擎。因此，ONNX 被当成了深度学习框架到推理引擎的桥梁，就像编译器的中间语言一样。由于各框架兼容性不一，我们通常只用 ONNX 表示更容易部署的静态图。

2. ONNX runtime 运行 BERT

2.1 加载数据与模型

2.2 导出ONNX模型

2.3 PyTorch 推理

2.4 使用 ONNX runtime 推理

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
【VScode推理模型部署】ONNX runtime

简单来说，对于机器学习模型过程可分为和这一条流水线解决了模型部署中的两大问题：使用对接深度学习框架和推理引擎的中间表示，开发者不必担心如何在新环境中运行各个复杂的框架；通过中间表示的网络结构优化和推理引擎对运算的底层优化，模型的运算效率大幅提升。接下来，我们将通过一步步的实践来体验模型部署的过程。
复制链接

扫一扫

CSDN认证博客专家 CSDN认证企业博客

码龄5年

南京航空航天大学

275: 原创

3万+: 周排名

9241: 总排名

26万+: 访问

: 等级

3346: 积分

164: 粉丝

519: 获赞

49: 评论

1696: 收藏

私信

关注

热门文章

分类专栏

最新评论

i++和++i的区别
2401_84856285: 因为a=i++，i离a近，所以i先赋值给a，感觉可以这样理解
i++和++i的区别
谢天若怜: 我有个疑问比如 a=1，b=0 while（a<5） b=b+a a++ 这个时候上面写a++和++a是不是都可以？
修改txt文件内容每行第一列
Oscar156: 相当好用感谢博主
时空序列预测模型—PredRNN(Pytorch)
白话机器学习: 博主的文章细节很到位，兼顾实用性和可操作性，感谢博主的分享，期待博主持续带来更多好文
wsl2 + libtorch + MKL
m0_71280633: 这个报错是咋解决的呀

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Dataloading... 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。