ONNX:
我们可能会在某一任务中将Pytorch或者TensorFlow模型转化为ONNX模型(ONNX模型一般用于中间部署阶段),然后再拿转化后的ONNX模型进而转化为我们使用不同框架部署需要的类型。
https://oldpan.me/archives/talk-about-onnx
https://oldpan.me/archives/pytorch-c-libtorch-inference
https://blog.csdn.net/computerme/article/details/80517796
https://blog.csdn.net/manong_wxd/article/details/78720236
TVM:
TVM针对不同的深度学习框架和硬件平台,实现了统一的软件栈,以尽可能高效的方式,将不同框架下的深度学习模型部署到硬件平台上.TVM 堆栈的目标在于提供一个可重复使用的工具链来将高级神经网络描述从深度学习框架前端向下编译为多硬件后端的低级机器代码
https://blog.csdn.net/tlzhatao/article/details/93630910
https://blog.csdn.net/weixin_30631587/article/details/96772606
https://blog.csdn.net/sanallen/article/details/79402174