Optimizing CNN Model Inference on CPUs翻译
摘要
卷积神经网络(CNN)模型的普及以及CPU的普遍存在意味着CNN模型在CPU上推理的更好性能可以为大量用户带来可观的收益。为了提高CNN推理在CPU上的性能,当前的方法(例如MXNet和Intel OpenVINO)通常将模型视为图形,并使用诸如Intel MKL-DNN的高性能库来实现图形的操作。尽管可以通过现成的库在单个操作上实现合理的性能,但由于预定义了本地操作级别的优化,因此该解决...
原创
2019-11-25 10:55:12 ·
1397 阅读 ·
1 评论