Hybrid intelligence for dynamic job-shop scheduling with deep reinforcement learning and attention

提示:自己觉得这篇文章挺好的,想要复现时,没看到更多的参考资料,此篇文章记录一下自己目前的步骤,给读者提供一个参考。

前言

最近,接触了车间调度问题,看到清华深圳研究院发的这篇文章,使用深度强化学习和注意力机制,解决车间调度问题,文章提出了一个gymjsp基准。
文章
代码


一、代码运行

(1)直接从github上下载代码,使用pycharm运行
(2)安装下面三个包在这里插入图片描述
(此外还缺一些基础的python包,缺什么安什么)

(3)运行test.py
在这里插入图片描述
tmp.html就是运行结果,内容如下
在这里插入图片描述
踩过的坑:
(1)github上介绍,指出安装gymjsp,但很多人运行都找不到这个包
在这里插入图片描述
在Issues里面,有提出以下解决方法
在这里插入图片描述
我也创建了,但在python setup.py install 时,报错。
思考:下载文件里面已经有了gymjsp了,这个基准似乎还没发布,无法使用pip命令直接安装。
在这里插入图片描述

二、论文总结

1.论文提出的几个有意思的点

(1)动态调度规则比单一固定调度规则具有优越性。
(2)并非rainbow里面所有的扩展对于动态作业调度有用。
(3)分派规则作为操作总是比使用合格或无限制的操作更好(更重要的是,使用调度规则作为行动空间提供了一种原则性的方法,能够将结构化的领域知识和数据驱动的智能统一起来,从而提高灵活性和效率)

总结

以上是一个简单的记录,欢迎大家相互交流。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值