前不久,南大俞扬教授创办的公司编写了一本白皮书,总结了数据驱动强化学习在工业控制领域的应用经验,这项先进的人工智能技术已在化工、火电、水务等多个工业场景落地,这就证明强化学习智能决策可以实现“0试错”应用,实乃一大突破。
为什么说在工业领域的应用十分重要呢,首先是工业生产本身面临资源紧缺、能耗高、污染重、产品附加值低等问题,二则国家大力倡导各行各业数字化、智能化转型,三则工业领域的数字化、智能化转型是数字产业化的发展土壤。因此,人工智能技术在工业领域的落地必然受到关注。
数据驱动强化学习在实际业务场景中取得应用成效
《强化学习控制白皮书》中的数据驱动强化学习决策技术,与市场主流的监督学习和强化学习方式不同,能真正从数据中回答“怎么做”的问题。数据驱动强化学习突破了强化学习在应用过程中试错成本高、训练周期长等难题,迅速在实际业务中落地,解决传统工业控制中普遍面临的痛点,如:
(1)多个环节由人工把控,依赖经验知识,不精准、不稳定且响应速度慢;
(2)过程控制基于经典控制算法,难以满足大范围动态条件复杂系统的优化控制需求;
(3)系统运维缺乏数据支撑,故障难预警、风险不可控。
以上流程控制中的不足,常造成企业品质或产量不稳、生产线持续性不足、生产损耗过大、生产成本难以控制等方面的问题。
此处列举一个运用数据驱动强化学习决策技术提升水系统增压泵房控制精度的案例,更多关于高稳定策略、大滞后策略、全局策略的解决方案,见文末完整版白皮书:
增压泵房是给水系统中的重要组成部分,为城市供水管