2021-06-15

最新推荐文章于 2023-06-23 14:29:13 发布

风的语言_

最新推荐文章于 2023-06-23 14:29:13 发布

阅读量177

点赞数

分类专栏：文献

本文链接：https://blog.csdn.net/qq_42544836/article/details/117928629

版权

文献专栏收录该内容

7 篇文章 0 订阅

订阅专栏

该文章探讨了一种解决流水车间调度问题的新方法，目标是最小化最大完工时间。通过结合深度学习和强化学习，提出深度强化学习(DRL)模型进行问题建模。此外，设计了一种带反馈机制的迭代贪婪算法，利用网络输出作为初始解，并通过多种局部操作改进搜索性能。该算法根据性能反馈调整操作使用，最终得出优化的调度方案。研究强调了DRL在挖掘问题特征和决策优化方面的潜力。

摘要由CSDN通过智能技术生成

基于深度强化学习与迭代贪婪的流水车间调度优化
以最小化最大完工时间为目标, 提出求解流水车间调度
设计一种新的编码网络对问题进行建模
利用强化学习训练模型以获取优良输出结果
提出一种带反馈机制的迭代贪婪算法, 以网络的输出结果为初始解, 协同利用多种局部操作提高搜索能力, 并根据性能反馈来调节各操作的使用, 进而获得最终的调度解。
将深度学习与强化学习结合形成深度强化学习(Deepreinforcementlearning, DRL), 可自主挖掘问题的特征, 积累问题信息并进行决策优化, 有助于设计面向特定问题的有效优化方法.
1 调度问题描述
PFSP[1]考虑有n 个工件J = {J1, J2, . . . , Jn}在m台机器M = {M1, M2, . . . , Mm}上加工过程, 各工件Ji 均需以相同的顺序通过m个机器完成相应的操作{Oi1, Oi2, . . . , Oim}, 其中Oij表示工件Ji在机器Mj上的加工操作. 已知工件Ji 在机器Mj 上的加工时间pij , 需确定所有工件的合理加工顺序π = (π1, π2, . . . , πn), 使得所有工件的最大完成时间Cmax最小.