本章主要介绍,不同处理器,CPU、GPU、DSP如何做并行计算加速,这要求我们掌握不同处理器的硬件特性,如寄存器的尺寸和个数、Cache的大小,还有指令支持,这些都是计算优化中很重要的影响因素,同时需要学习Neon、OpenCL、OpenGL、HVX编程,此外,对于DSP,我们还需要掌握量化算法。下面我们就按照CPU、GPU、DSP的顺序来介绍优化思想。
深度学习计算框架综述(八)并行计算优化思想
最新推荐文章于 2024-07-21 15:35:15 发布
本章主要介绍,不同处理器,CPU、GPU、DSP如何做并行计算加速,这要求我们掌握不同处理器的硬件特性,如寄存器的尺寸和个数、Cache的大小,还有指令支持,这些都是计算优化中很重要的影响因素,同时需要学习Neon、OpenCL、OpenGL、HVX编程,此外,对于DSP,我们还需要掌握量化算法。下面我们就按照CPU、GPU、DSP的顺序来介绍优化思想。