Distributed Cooperative Reinforcement Learning-Based Traffic Signal Control That Integrates V2X
基于 V2X网络 动态聚类算法 的分布式协同强化学习流量控制。
主要思路
准确即时获取交通流信息 -> V2X集群稳定 -> 提出一种新的动态聚类算法
控制平衡流量 -> 协同强化学习
问题背景
目前,大多数的ITS系统根据安装在交叉路口附近的 传感器感测 的实时交通数据来计算。难以维护和更新
-> 利用短程无线通信:V2X网络
通过VANET获得实时交通道路信息。这种方法为车辆检测和交叉口合作提供了新的方法。当车辆在红绿灯前等候时,会将他们的相关信息发送给交叉路口代理。
-> V2X网络的信息通信组织:集群结构,因此需要考虑如何 维持群集稳定性 --> 提出稳定聚类算法
-> 获得交通信息后,考虑交通信号控制优化:协同强化学习 -> 如何解决高维问题(利用函数逼近技术) -> 如何解决逼近方法的较慢收敛性(运用快速梯度下降这种逼近方法)