IJCAI2022《对抗序列决策》教程

d70fae2c8b757ff1b76fc8ac251fcf99.png

来源:专知
本文为教程,建议阅读5分钟
本教程将概述在序列决策设置中的对抗性学习的最新研究。

2d2395f6437a9291d3b028dc23b32454.jpeg

本教程将概述在序列决策设置中的对抗性学习的最新研究。特别地,本教程将侧重于基于多臂赌博机、强化学习和多智能体交互的对抗性攻击和防御机制。本教程将暂时涵盖以下列出的内容。

https://adversarial-rl.org/ijcai2022/index.html

  • 介绍

    • 序列决策入门: 多臂赌博机,强化学习,多智能体交互,和博弈。

    • 对抗性序列决策如何不同于对抗性监督学习的高级概述。

    • 攻击策略和防御机制的高级概述。

  • 多臂赌博机

    • 不同反馈破坏模型和目标下的最优攻击策略。

    • 最近在设计鲁棒算法、关键挑战和开放问题方面的工作。

  • 强化学习

    • 讨论不同的学习范式(例如,模仿学习、离线学习和在线学习),以及它们在对抗性攻击中是如何区别的。

    • 测试时间、训练时间和后门攻击的最优攻击策略。

    • 不同数据破坏模型和攻击目标下的最优攻击策略。

    • 最近在设计鲁棒算法、关键挑战和开放问题方面的工作。

  • 多智能体相互作用和博弈论考虑

    • 多智能体系统中通过控制其他智能体的攻击和非健忘攻击。

    • 利用博弈论工具防御攻击。

  • 实际考虑和讨论

    •  针对学习代理的安全威胁案例研究。

    • 在对抗性序列决策中开发基准工具和数据集。

    •  与观众公开讨论,促进跨社区合作。

09ded79df41eb06ef05a7746b97c5cdc.jpeg

a987946ba03c69ecdb7b44077e089bdf.jpeg

b816f27ffcf940d5644ff726b46b59b9.jpeg

655d1fa2341b9e71508b917d79ee337b.jpeg

915c20d3d160705db49021440bc73bcd.jpeg

fc58b9a753ab20620dce88602de24a03.jpeg

f8cc33fc6a9fedbdae398ff6e75e94af.jpeg

3c2965e4d48c661e434ce4e358594314.jpeg

fe98706e1cba9370ad7f8cc36641cdf7.png

89bac5fb4f5206fdafbc19c22f7ae600.png

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值