基于深度强化学习的智能车间调度方法研究

最新推荐文章于 2025-04-03 22:01:52 发布

罗思付之技术屋

最新推荐文章于 2025-04-03 22:01:52 发布

阅读量300

点赞数 3

分类专栏：综合技术探讨及方案专栏文章标签：边缘计算人工智能

本文链接：https://blog.csdn.net/fzq0625/article/details/135511856

版权

综合技术探讨及方案专栏专栏收录该内容

97 篇文章 ¥69.90 ¥99.00

订阅专栏

超级会员免费看

本文探讨了工业物联网背景下的智能车间调度问题，提出了基于深度强化学习（DRL）的车间调度算法。研究将车间调度问题定义为马尔可夫决策过程，建立了一个基于指针网络的模型，并通过DRL解决复杂状态空间和动作空间的调度挑战。实验结果显示，提出的算法在不同规模问题上表现出优越性能，尤其在中大规模问题上优于传统方法，证明了DRL在车间调度中的有效性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

摘要:

工业物联网的空前繁荣为传统的工业生产制造模式开辟了一条新的道路。智能车间调度是整个生产过程实现全面控制和柔性生产的关键技术之一，要求以最大完工时间最小化分派多道工序和多台机器的生产调度。首先，将车间调度问题定义为马尔可夫决策过程，建立了一个基于指针网络的车间调度模型。其次，将作业调度过程看作是从一个序列到另一个序列的映射，提出了一种基于深度强化学习的车间调度算法。通过分析模型在不同参数设置下的收敛性，确定了最优参数。在不同规模的公共数据集和实际生产数据集上的实验结果表明，所提出的深度强化学习算法能够取得更好的性能。

关键词：工业物联网 ; 智能车间调度 ; 柔性生产 ; 深度强化学习 ; 车间调度方法

0 引言

工业物联网（IIoT, industrial internet of things）作为新一代信息技术与制造业深度融合的产物，通过实现人、机、物的全面互联，为传统的工业生产制造模式开辟了一条新的道路。IIoT中设想的智能车间如图1所示，采用“云-边-端”3层架构，终端各种类型的传感设备综合感知实时生产数据，并通过无线传感器网络实时传输到边缘服务器，在边缘端使用云端训练好的车间调度模型结合订单、物料等系统，对等待生产的作业进行快速排产调度，然后将调度结果通过生产指令的方式下发到生产线执行，以实现整个生产过程的自动化、智能化、无人化。图1 中虚线表示从下层到上层（如端到边、边到云）