目录
async def reset_shard(self, shard: Shard)
async def ensure_shard(self, shard: Shard)
DynamicShardInferenceEngine
这段代码定义了一个类,是为了处理分布式或分片模型中的推理任务而设计的。它包含几个关键的方法和属性,用于与模型的分片进行交互,执行推理任务,并管理模型的状态。下面是对这些方法和属性的详细解释:
属性
self.shard
: 用于存储当前正在使用的模型分片的引用。初始时设置为None
,表示没有当前分片。