Model-Free Control for Distributed Stream Data Processing using Deep Reinforcement Learning(VLDB18)

在本文中,我们重点研究了通用分布式流数据处理系统(dsdps),该系统可以在实时或接近实时的情况下处理大规模的无界连续数据流。DSDPS中的一个基本问题是调度问题(即,将工作负载分配给工人/机器),其目标是最小化平均端到端元组处理时间。一种广泛使用的解决方案是以循环的方式将工作负载均匀地分布在集群中的机器上,这显然不是一种简单的方法.

本文旨在开发一种新的无模型方法,可以学习从其经验中很好地控制DSDPS,而不是准确的和数学可解决的系统模型,就像人类学习一项技能(如烹饪、驾驶、游泳等)。首次建议利用新兴的深度强化学习(DRL)在DSDPSs中实现无模型控制;设计、实现和评估一种新颖的、高度有效的基于深度强化学习的控制框架,通过收集非常有限的运行时统计数据和在强大的深度神经网络(DNNs)指导下做出决策,通过联合学习系统环境,最小化平均端到端元组处理时间。为了验证和评估所提出的框架,基于广泛使用的DSDPS Apache Storm实现了该框架,并在连续查询、日志流处理和单词计数(流版本)3个具有代表性的应用上进行了测试。实验结果表明:1)与Storm默认调度器和基于模型的方法相比,该框架平均减少元组处理次数33.5%和14.0%。2)所提框架能够在在线学习过程中快速得到较好的调度解,在DSDPSs中的在线控制中具有实用性

问题:

DSDPS中的一个基本问题是调度问题(即,将工作负载分配给工人/机器),其目标是最小化平均元组处理时间。

DESIGN AND IMPLEMENTATION OF THE PROPOSED FRAMEWORK 

 我们在图1中说明了所提出的框架,可以看到它有两个部分:DSDPS和基于drl的控制。该架构相当简单干净,由以下组件组成。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值