DeviceContext是非CPU设备执行计算操作的核心类,重点提供了stream虚函数、以及张量拷贝相关函数。并且根据不同设备进一步派生出不同的设备上下文类(GPUDeviceContext、SYCLDeviceContext、XlaDeviceContext)。
与CPU设备不同 GPU设备(SYCL/XLA/RPC也一样),设备在执行具体计算任务时并不是给Eigen底层计算的,而是由设备底层接口计算的(例如cuda),当计算较多时,不同节点的与底层设备的交互并不是直接调用相关接口,而是通过传入执行函数的函数指针、执行所需的数据流、以及执行的设备信息到一个ThenExecute函数中,由ThenExecute函数执行具体的计算操作。
//设备的上下文信息类,注意继承自一个通用的计数器类,为一个抽象类
class DeviceContext : public core::RefCounted {
public:
~DeviceContext() override {}
virtual stream_executor::Stream* stream() const { return nullptr; }//TF流
//维持流的生命周期
virtual void MaintainLifetimeOnStream(const Tensor* t,
stream_executor::Stream* stream) const {
}
// 拷贝CPU张量到设备上(GPU/TPU)
virtual void CopyCPUTensorToDevice(const Tensor* cpu_tensor, Device* device,
Tensor* device_tensor, StatusCallback done,