![8e7767df11e686aaf2771ce5f5921eb7.gif](https://img-blog.csdnimg.cn/img_convert/8e7767df11e686aaf2771ce5f5921eb7.gif)
文 / 软件工程师 Juhyun Lee 和 Raman Sarokin
TensorFlow Lite (TFLite) GPU 团队在不断改进现有基于 OpenGL 的移动 GPU 推理引擎,同时我们也在不断研究其他技术。在我们所开展的实验中,有一个实验相当成功。在此,我们很高兴地为 Android 推出基于 OpenCL 的移动 GPU 推理引擎,与现有的 OpenGL 后端相比,对适当大小的神经网络(为 GPU 提供足够的工作负载),能够提供高达 2 倍的加速。
![619223f4f7b353b0ef118e66f02fe45f.gif](https://img-blog.csdnimg.cn/img_convert/619223f4f7b353b0ef118e66f02fe45f.gif)
图 1. OpenCL 后端可为 Duo 的 AR 特效提供技术支持
对 OpenGL 后端的改进
一直以来,OpenGL 都是为渲染矢量图形而打造 API。我们已在 OpenGL ES 3.1 中添加计算着色器 (Compute shaders),但限于其向后兼容的 API 设计限制,无法发挥出 GPU 的全部潜力。另一方面,OpenCL 本就是为在不同加速器上开展计算工作而设计的,因而与移动 GPU 推理领域尤为相关。因此,我们研究出了基于 OpenCL 的推理引擎