tensorflow编译-cpu指令优化相关选项说明
总结如下:AVX,SSE4.1,SSE4.2,MFA是X86 CPU上不同类型的扩展指令集。其中许多包含处理矩阵或向量操作的优化指令。注意:并不是SSE4.2是取代SSE4.1的较新版本的指令。SSE 4=SSE4.1(一组47条指令)+SSE4.2(一组7条指令)。在TensorFlow编译的上下文中,如果您的计算机支持AVX 2和AVX,以及SSE4.1和SSE4.2,则应该为所有人设...
原创
2019-03-21 15:38:56 ·
2377 阅读 ·
0 评论