深度学习
Conn22
学生一枚
展开
-
Multi-Agent Deep Reinforcement Learning for Large-scale Traffic Signal Control
目录摘要引言方法总结本文将A2C算法与IQL算法结合,应用到多体的交通信号灯领域,并且为了解决部分可观测的、非稳定的问题,采取了综合邻居信息和空间衰减因子的方法。摘要对于复杂城市交通网络的适应性交通信号灯控制(adaptive traffic signals control),强化学习(RL)是一种非常有前景的方法,并且深度神经网络进一步增强了它学习的能力。问题:然而,对于大规模的ATSC,由于联合动作空间的极度高维度,集中化的RL是不可行的。MARL(multi agent原创 2020-10-27 11:37:59 · 2152 阅读 · 0 评论 -
针对数据集Fashion_MNIST的白盒、黑盒攻击
目录思路实验总结参考资料思路白盒攻击假设我们图像的数组为x,模型已经正确分类到y_true,这时我们需要进行白盒攻击,微小地修改图像数组x使得模型将其分类到y1 给模型输入(x,y1)获取到模型在输入x上的梯度,这里的x便是图像的数组表示 依据梯度,在图像上进行调整,以达到减小误差,判断是否此时模型将其分类到y1 重复2、3步,直到模型将其分类到y1或者超出时间限...原创 2019-04-07 16:07:11 · 3972 阅读 · 1 评论