最大化TensorFlow* CPU性能（shell）

chen_ ：)

已于 2022-02-27 21:23:37 修改

阅读量1k

点赞数 1

分类专栏： ASC学习文章标签： tensorflow 人工智能 python

于 2022-02-27 21:20:37 首次发布

本文链接：https://blog.csdn.net/weixin_51942493/article/details/123170596

版权

ASC学习专栏收录该内容

28 篇文章 1 订阅

订阅专栏

详细用法：最大化TensorFlow* CPU性能
原文：Maximize TensorFlow* Performance on CPU: Considerations and Recommendations for Inference Workloads

export TF_ENABLE_ONEDNN_OPTS=1

intra_op_parallelism = number of physical core per socket
#每个插槽的物理内核数

inter_op_parallelism = number of sockets

get the number of physical core per socket and number of sockets on your platform

#!/bin/bash
total_cpu_cores=$(nproc)
number_sockets=$(($(grep "^physical id" /proc/cpuinfo | awk '{print $4}' | sort -un | tail -1)+1))
number_cpu_cores=$(( (total_cpu_cores/2) / number_sockets))

echo "number of CPU cores per socket: $number_cpu_cores";
echo "number of socket: $number_sockets";

data_format = NHWC

export TF_ENABLE_MKL_NATIVE_FORMAT=1 (or 0)

numactl --cpunodebind=0 --membind=0 python

numactl --cpunodebind=N --membind=N python

numactl --cpunodebind=0 --membind=0 python & numactl --cpunodebind=1 --membind=1 python

export OMP_NUM_THREADS=num physical cores

export KMP_AFFINITY=granularity=fine,compact,1,0

export KMP_BLOCKTIME=0 (or 1)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

chen_ ：)

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
最大化TensorFlow* CPU性能（shell）

详细用法：最大化TensorFlow* CPU性能添加链接描述原文：Maximize TensorFlow* Performance on CPU: Considerations and Recommendations for Inference Workloadsexport TF_ENABLE_ONEDNN_OPTS=1intra_op_parallelism = number of physical core per socket#每个插槽的物理内核数inter_op_parallel
复制链接

扫一扫