使用winmltools API 将onnx模型转换为半精度以加快推理速度

最新推荐文章于 2023-12-06 13:24:53 发布

znsoft

最新推荐文章于 2023-12-06 13:24:53 发布

阅读量2.1k

点赞数 1

分类专栏： ML ONNX 文章标签：深度学习

本文链接：https://blog.csdn.net/znsoft/article/details/114538684

版权

ML 同时被 2 个专栏收录

4 篇文章 0 订阅

订阅专栏

ONNX

4 篇文章 0 订阅

订阅专栏

from winmltools.utils import convert_float_to_float16
from winmltools.utils import load_model, save_model
onnx_model = load_model('model.onnx')
new_onnx_model = convert_float_to_float16(onnx_model)
save_model(new_onnx_model, 'model_fp16.onnx')

说明下： winmltools这个python包，我只在ubuntu 20.04下安装成功，其它平台下因为libprotobuf的版本原因，失败鸟，有兴趣的可以升级libprotobuf试试。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

znsoft

关注关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

winmltool:一个简单的WITSML客户端

05-03

winmltool 一个简单的WITSML客户端如今，WITSML被广泛用于在各方之间交换钻井数据。作为提供WITSML服务的服务公司之一，我们有时不知道客户是否以正确的方式接收数据。除了问他们数据在末端如何看。这就是编写此简单实用程序背后的原因。！[替代文字]（WinMLTool2 / screenshots / IE10-Win7.png“描述在这里”）它实际上所做的是打印可用井和井眼的列表，以及与之关联的测井对象。用法很简单。但是请注意，它仅适用于API井；连接到度量标准数据库时，您将获得怪异的值。

Python环境下将ONNX模型转为fp16 半精度浮点方式

weixin_42492254的博客

05-13

7163

背景在TX2上和NX上跑自己想要的模型还是有点慢，由于Jetpack4.6.2的TensorRT8.2对于有16G内存的NX支持存在问题运行不了（8G内存没有问题），可以运行的TensorRT7不支持我这边模型用到的einsum操作，所以我先想着改成fp16运行下看看参考 https://blog.csdn.net/znsoft/article/details/114538684 流程参考代码其实挺简单，但是python环境安装过程有点坎坷，建议新建一个虚拟环境来安装，好像有人把环境都直接装崩了新

1 条评论您还未登录，请先登录后发表或查看评论

pytorch深度学习入门（16）之-使用onnx模型混合精度Float16量化

ajunbin859的专栏

11-17

1579

将模型转换为使用 float16 而不是 float32 可以减小模型大小（最多一半）并提高某些 GPU 上的性能。可能会有一些精度损失，但在许多模型中，新的精度是可以接受的。ORT 将在运行时优化这对，因此结果将保持全精度。混合精度工具的工作原理是将操作集群转换为 float16。如果 float16 转换的结果很差，您可以将大部分操作转换为 float16，但保留一些操作为 float32。由于 ONNX Runtime 的 CPU 版本不支持 float16 运算，并且该工具需要测量精度损失，因此。

ONNX模型推理

weixin_43999691的博客

03-23

1089

ONNX模型截断和推理

[实践]YOLOv5提升10倍推理速度：利用TensorRT 在Jetson NX上的模型部署

我爱计算机视觉

06-09

2643

关注公众号，发现CV技术之美本文转自空中机器人前沿，作者西湖大学工程师梁甲琛。随着算力的不断提升和数据的不断增长，深度学习算法有了巨大的发展。深度学习算法也越来越多的应用在各个领域中，比如图像识别算法应用于自动驾驶领域和安防等场景，再比如语音处理和自然语言处理应用于人机交互，以及近期火热对于许多领域都有重大影响的AIGC。针对不同的平台，如何使深度学习算法的推理速度更快，无疑可以影响用户的体验，...

将tf.kerasKeras模型转换为ONNX-源码.zip

08-17

总结一下，将tf.keras Keras模型转换为ONNX的关键步骤包括：安装必要的库、加载Keras模型、将Keras模型转换为TensorFlow计算图、使用`onnx-tf`将TensorFlow模型转换为ONNX模型，最后将ONNX模型保存到磁盘。...

模型转换-OpenVINO模型IR-XML转换为onnx模型-附项目源码+使用教程-优质项目实战.zip

最新发布

06-07

然而，有时我们需要将模型转换为其他框架兼容的格式，比如ONNX，以便于跨平台的模型共享和协作。ONNX是一种开放标准，支持多种框架之间的模型导入导出，如TensorFlow、PyTorch和Caffe等。在本项目中，您将找到一个...

fp16tensorRT:基于API的TensorRT模型上的TensorRT半精度推理例程

05-09

这是用C ++ TensorRT API编写的TensorRT模型的工作示例，以半精度模式运行推理。可以运行全精度和半精度模式的推断。内容 demo.cpp模型定义和推断 wts_gen_demo.py权重文件从numpy数组的常规字典转换为TensorRT ...

yolov8的onnx模型转换成tensorRT的engine模型

01-29

本话题将详述如何将Yolov8的ONNX模型转换为TensorRT的engine模型，以实现GPU上的高效推理。首先，我们需要了解ONNX。ONNX是一个开放源代码项目，旨在促进AI模型的互操作性。它提供了一种统一的模型表示，使得训练...

使用ONNX Runtime推理模型.pdf

04-15

ONNX Runtime的核心优势在于其对ONNX格式的支持，这使得开发者可以轻松地将模型从训练环境转移到生产环境中，而无需担心框架之间的兼容性问题。 ##### 2.2 ONNX模型格式 ONNX (Open Neural Network Exchange) 是一...

PINTO_model_zoo：一个共享TensorFlow Keras生成的经过训练的模型的调整结果的存储库。训练后量化（权重量化，整数量化，完全整数量化，Float16量化），量化意识训练。 TensorFlow Lite。 OpenVINO。 CoreML。 TensorFlow.js。 TF-TRT。 MediaPipe。 ONNX。 [.tflite，.h5，.pb，saved_model，tfjs，tftrt，mlmodel，.xml.bin，.onnx]

02-06

PINTO_model_zoo 使用模型之前，请阅读每个文件夹正下方的LICENSE文件的内容。我的模型转换脚本是根据MIT许可证发布的，但是源模型本身的许可证受提供者存储库的许可证约束。共享Tensorflow生成的经过训练的模型的调整结果的存储库。训练后量化（权重量化，整数量化，完全整数量化，Float16量化），量化意识训练。我还尝试将其尽可能转换为OpenVINO的IR模型。 TensorFlow Lite，OpenVINO，CoreML，TensorFlow.js，TF-TRT，MediaPipe，ONNX [.tflite，.h5，.pb，Saved_model，tf

onnxruntime对bfloat16的支持

lbai7134的博客

11-16

1438

onnxruntime对bfloat16的支持

解决yolov5使用onnxruntime推理时耗时问题（cpu环境）

athrunsunny的博客

11-10

9057

yolov5将训练好的模型转换成onnx格式，在使用转换后的onnx格式的权重进行推理时作者使用如下语句： # Inference if pt: visualize = increment_path(save_dir / Path(path).stem, mkdir=True) if visualize else False pred = model(img, augment=augment, visualize=visua...

onnx的所有计算数据修改为float16

weixin_42294118的博客

12-06

600

【代码】onnx的所有计算数据修改为float16。

半精度（FP16）调试血泪总结

idol24的博客

07-23

1691

通常我们训练神经网络模型的时候默认使用的数据类型为单精度（FP32），在该阶段要花费很多的运行时间；而在部署时，为了减少计算量，可以考虑使用16位浮点数，也就是半精度（FP16）。作者丨AllentDan@知乎链接丨https://zhuanlan.zhihu.com/p/510574300问题描述MMOCR在MMDeploy中部署时，PANet模型在以TensorRT-...

模型量化！ONNX转TensorRT(FP32, FP16, INT8)

qq_43522163的博客

07-10

6588

模型量化！ONNX转TensorRT(FP32, FP16, INT8)

pytorch 38 对tensorRT、openvino、onnxruntime（fp32、fp16）推理速度进行对比

a486259的博客

04-17

4038

tensorRT与openvino部署模型有必要么？本博文对tensorRT、openvino、onnxruntime推理速度进行对比，分别在vgg16、resnet50、efficientnet_b1和cspdarknet53四个模型进行进行实验，对于openvino和onnxruntime还进行了cpu下的推理对比。对比囊括了fp32、fp16两种情况。在float32下通过实验得出：openvino GPU < onnxruntime CPU

[ONNX从入门到入土]FP32-＞FP16转换

qq_18236971的博客

03-18

4468

Float16 Python Conversion script

onnx精度验证

xiaoxiannvyi的博客

05-20

3670

一、yolov5-v6.1 onnx模型转换 1、export.py 参数设置：data、weights、device(cpu)、dynamic(triton需要转成动态的)、include 建议先转fp32，再转fp16： import onnxmltools from onnxmltools.utils.float16_converter import convert_float_to_float16 # Update the input name and path for your