题目内容 深度学习算法由一个个计算单元组成,我们称这些计算单元为算子。 对于完成矢量运的算子我们称为矢量算子,在 N P U NPU NPU 中矩阵计算单元和向量计算单元都可以执行矢量算子,他们是独立可并行执行的,但他们的计算效率是6:1,即假设某个失量算子在矩阵计算单元上执行的时间为