tensorflow源码分析（六）设备管理

最新推荐文章于 2024-05-25 23:04:48 发布

hobertony_7

最新推荐文章于 2024-05-25 23:04:48 发布

阅读量705

点赞数

分类专栏： tensorflow

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hobertony_7/article/details/85111428

版权

tensorflow 专栏收录该内容

15 篇文章 2 订阅

订阅专栏

接下来介绍一下tensorflow对设备devices的发现和管理，负责运行kernel的具体硬件设备抽象成为devices；实现某种操作的算法叫做kernel，可以将kernel看做是一段能够跑在具体硬件设备上的算法程序，所以相同的算法实现，在gpu上有一套实现，在cpu上有一套实现。

在session初始化时会调用add_device接口，把cpu gpu设备添加到session到devices_表中。

上图主要介绍再本地运行时tensorflow内部对设备的抽象模型以及在源码中对设备抽象的类的继承关系，非本地的设备抽象类时remotedevice，这里不再详细介绍。

GPUCompatibleCPUDevice实例：

1)将 cpu 的计算资源抽象为thread pool，以支持多thread之间的并发执行；

2)将主机内存抽象为 CPUAllocator 实例来进行管理，为cpu kernel、gpu kernel提供主机内存的申请、释放功能；

(如何对cpu资源抽象可以进一步研究的点)

GPUDevice实例：

1)将gpu的计算资源抽象为streams，由于目前只支持NVIDIA的gpu，所以这里我们可以看作抽象为cuda streams，多个cuda streams之间的计算可以并发处理；

2)通过GPUBFCAllocator实例来管理显存，为gpu kernel提供显存的申请、释放功能。

（gpu资源管理以及与cuda库的配合可以作为可以继续研究的点）

Tensorflow系统中可用的device实例在session初始化时创建，并由该session使用，归属于该session，device的创建使用的是factory模式。

该图主要描述了graph运行时时如何与device的抽象类交互，devices_是在session初始化时构建生成，里面包含了该session所有的可用设备，executor执行器会把graph中相应得node交给设备运行，其实就是在设备上执行node对应得opkernel。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
tensorflow源码分析（六）设备管理

接下来介绍一下tensorflow对设备devices的发现和管理，负责运行kernel的具体硬件设备抽象成为devices；实现某种操作的算法叫做kernel，可以将kernel看做是一段能够跑在具体硬件设备上的算法程序，所以相同的算法实现，在gpu上有一套实现，在cpu上有一套实现。在session初始化时会调用add_device接口，把cpu gpu设备添加到sessi...
复制链接

扫一扫

专栏目录

hobertony_7 CSDN认证博客专家 CSDN认证企业博客

码龄10年

42: 原创

10万+: 周排名

69万+: 总排名

19万+: 访问

: 等级

2146: 积分

24: 粉丝

35: 获赞

17: 评论

225: 收藏

私信

关注

热门文章

分类专栏

qt 10篇
freerdp
linux 36篇
kvm 5篇
libvirt 1篇
openstack 2篇
nova 1篇
docker 4篇
python 6篇
etcd 2篇
tensorflow 15篇

最新评论

cannot access storage file (as uid:107, gid:107)permission denied
qq_30426633: 这边遇到了同样的情况，这边先切换到root权限，在root权限下把文件系统换成Ext4然后复制了一遍文件就可以正常使用了。
cgroup 管理cpu资源
安靜的晴天: 你需要在/sys/fs/cgroup/cpu/新建一个目录比如/test，它会自动生成和/sys/fs/cgroup/cpu/一样的内容。把要控制的PID写入入/sys/fs/cgroup/cpu/test/tasks 再修改echo 2000 > /sys/fs/cgroup/cpu/test/cpu.cfs_quota_us。（因为这个目录/sys/fs/cgroup/cpu/的是不可更改的）
numba与numpy对比
杨树: 主要还是numpy，因为numba依赖于numpy
cgroup 管理cpu资源
Gat0288: echo 2000 > /sys/fs/cgroup/cpu/cpu.cfs_quota_us 运行后出现 -bash: echo: 写错误: 无效的参数是什么情况
python层和c++分别实现图像维度转置算法：
天天向上的小白白~: 所以一个cv::mat对象怎么使用数组下标呢

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。