文章目录
Abstract
本文研究了流处理中的资源分配问题,即在大型分布式系统中如何实时处理连续的数据流。为了使系统吞吐量最大化,将流处理图的计算任务划分到计算设备上的资源分配策略必须同时平衡工作负载分布和最小化通信。在本文中,作者提出了一个图感知(graph-aware)的编码解码器框架来学习一种可推广(generalizable)的资源分配策略,该策略可以正确地分配从训练数据中未观察到的流处理图的计算任务。本文首次提出利用图嵌入来学习流处理图的结构信息。使用深度强化学习的图感知解码器联合训练,本文方法可以有效地找到未知图的优化解。
introduction
基本概念
A stream graph is comprised of operators, which conduct computation on the incoming tuples, and directed edges, each of which connects two operators and transmits tuples between them. Tuples are structured data items with strongly-typed attributes. Operators are event-driven and execute only when there is a tuple received.
一个流图由算子和定向边组成,前者对传入的元组进行计算&#x