Tensorflow在容器性能测试中的问题

最新推荐文章于 2022-12-23 10:28:36 发布

WesleyBluer

最新推荐文章于 2022-12-23 10:28:36 发布

阅读量366

点赞数

分类专栏：容器 docker

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/WesleyBluer/article/details/104170765

版权

容器同时被 2 个专栏收录

1 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

Docker是利用Linux操作系统自带的namespace实现资源的隔离，利用cgroup实现资源的限制。虽然Docker针对Linux硬件资源做了限制，但是当类似于java、python这样的语言，调用一些系统内核数据时，使用的仍然会是未进行隔离之前的数据。

在使用容器方式部署Tensorflow时，有两个限制线程数量的参数，即inter_op_parallelism_threads和intra_op_parallelism_threads，如果值为0，TF会自动选择一个合适的值，默认情况下，这个指就是所在机器的cpu核数。

但是，如果使用的容器方式进行部署，如k8s，虽然对容器的资源如cpu数量进行了限制，但是tensorflow在使用上述参数获取默认值时，仍然使用的是容器所在宿主机的cpu核数。这就造成了一个问题，即如果容器所在的物理机有40核，而容器自身将cpu限制为4核，那么Tensorflow在配置并行度线程时，仍然按照40核来进行设置，这样会造成实际的线程数量要比预计的多得多，而按照python的机制，线程数量的增多会导致GCroots变量的增多，除了线程自身所占的内存外，会有更多的堆内存无法释放，这样也会造成容器使用的内存大大增多。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Tensorflow在容器性能测试中的问题

Docker是利用Linux操作系统自带的namespace实现资源的隔离，利用cgroup实现资源的限制。虽然Docker针对Linux硬件资源做了限制，但是当类似于java、python这样的语言，调用一些系统内核数据时，使用的仍然会是未进行隔离之前的数据。在使用容器方式部署Tensorflow时，有两个限制线程数量的参数，即inter_op_parallelism_threads和int...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。