深度学习推理框架对比表

序号推理框架名称开发单位主要应用场景硬件支持性能表现易用性量化支持跨平台能力移动端优化视频流优化模型支持
1TVM社区开源项目跨平台(CPU/GPU/ARM)CPU/GPU/ARM中等(需手动调优)需手动调优支持 FP16/INT8强(多种硬件架构)支持不支持多框架(ONNX/TensorFlow/PyTorch)
2TensorRTNVIDIANVIDIA GPUNVIDIA GPU最快(GPU 优化)开箱即用支持 FP16/INT8仅限 NVIDIA GPU不支持不支持多框架(ONNX/TensorFlow/PyTorch)
3ONNXRuntime微软跨平台(云、边缘、移动设备)CPU/GPU/TPU/FPGA/边缘设备高(多种硬件加速)开箱即用,易于集成支持 FP16/INT8强(Windows、Linux、macOS、Android)支持不支持多框架(ONNX、TensorFlow、PyTorch、Keras 等)
4OpenVINOIntelIntel CPU/GPUIntel CPU/GPU快(CPU/GPU 优化)开箱即用支持 FP16/INT8仅限 Intel 硬件不支持不支持多框架(ONNX/TensorFlow/PyTorch)
5NCNN腾讯移动端/嵌入式ARM CPU/GPU中等(移动端优化)开箱即用支持 FP16/INT8跨平台(ARM/CPU/GPU)最优(轻量级设计)不支持多框架(ONNX/Caffe/TensorFlow)
6MNN阿里巴巴移动端ARM CPU/GPU中等开箱即用支持 INT8跨平台优化良好不支持多框架
7MediaPipeGoogle移动端、嵌入式多平台(支持 TPU)中等开箱即用支持 TF Lite 量化跨平台支持支持主要支持 TensorFlow
8ONNX Runtime微软、亚马逊、Facebook 等多平台(CPU/GPU)CPU/GPU中等开箱即用支持 FP16/INT8多平台支持不支持支持多种框架
9DeepStreamNVIDIA视频流处理NVIDIA GPU快(视频流优化)开箱即用支持 INT8仅限 NVIDIA GPU不支持最优支持多种框架
10Paddle Inference百度跨平台(CPU/GPU)CPU/GPU中等开箱即用支持 FP16/INT8跨平台支持不支持支持多种框架
11TNN腾讯移动端ARM CPU/GPU中等开箱即用支持 INT8跨平台优化良好不支持多框架
12LibTorchFacebook/Meta跨平台CPU/GPU中等开箱即用不支持跨平台不支持不支持多框架
13Paddle Lite百度移动端ARM CPU/GPU中等开箱即用支持 INT8跨平台优化良好不支持多框架
14MegEngine Lite旷视移动端ARM CPU/GPU中等开箱即用支持 INT8跨平台优化良好不支持多框架
15OpenPPL商汤跨平台CPU/GPU中等开箱即用支持 FP16跨平台不支持不支持多框架
16Bolt华为移动端CPU/GPU中等开箱即用支持 FP16跨平台不支持不支持多框架
17ExecuTorchFacebook/Meta跨平台CPU/GPU中等开箱即用不支持跨平台不支持不支持多框架
18DeepSpeed微软高性能推理CPU/GPU高吞吐量开箱即用英特尔 INT8跨平台不支持不支持多框架
19Llama.cppMeta苹果设备优化苹果设备高性能开箱即用苹果设备优化跨平台不支持不支持苹果设备优化
20FastDeployPaddlePaddle轻量级推理轻量级硬件中等开箱即用轻量级量化跨平台优化良好不支持轻量级优化
21DeepSparseIntel高性能推理CPU/GPU中等开箱即用英特尔 INT8跨平台不支持不支持高性能推理
22ORT-Nightly微软夜间版本CPU/GPU中等开箱即用夜间版本优化跨平台不支持不支持夜间版本优化
23TritonNVIDIA高性能推理NVIDIA GPU高性能开箱即用高性能优化跨平台不支持不支持高性能优化
24OpenVINO-QuantizedIntel量化优化Intel 硬件中等开箱即用量化优化仅限 Intel 硬件不支持不支持量化优化
25TVM-Quantized社区开源项目量化优化CPU/GPU/ARM中等开箱即用量化优化跨平台不支持不支持量化优化
26WebLLM社区开源项目浏览器端推理WebGPU高性能开箱即用无服务器架构跨平台不支持不支持支持多种模型
27VLLM社区开源项目高并发推理NVIDIA GPU高性能开箱即用支持多种量化仅限 Linux不支持不支持支持 Hugging Face 模型
28Ollama社区开源项目轻量级推理CPU/GPU高效推理简单易用支持多种量化跨平台不支持不支持支持多种模型
29SGLang社区开源项目企业级推理NVIDIA GPU高性能需技术基础支持多种量化Linux不支持不支持支持多种模型
30TensorFlow LiteGoogle移动端推理CPU/GPU中等开箱即用支持量化跨平台优化良好不支持支持 TensorFlow 模型
31KTransformers清华大学优化大语言模型推理CPU/GPU高性能开箱即用支持多种量化跨平台不支持不支持支持多种模型
32MACE小米移动端ARM CPU/GPU中等开箱即用支持 INT8跨平台优化良好不支持多框架

未完待续…

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值