网络安全文章研读——基于对抗性强化学习的网络安全系统

An adversarial reinforcement learning based system for cyber security

0x01 摘要

提出来一种基于RL的系统,保护用户免受恶意流量的侵害。

生成网络攻击生成agent和网络防御agent,基于深度神经网络环境,超越传统的ML算法,可以检测对抗样本

0x02 intro

基于DNN的方案容易被对抗样本日穿。

SVM和RL的方案对对抗样本检测性能不行。

贡献:

  1. 提出了一种全新的基于对抗性强化学习的网络安全入侵检测系统。
  2. 将经过训练的 CNN 作为攻击生成agent的交互环境,旨在生成对抗样本以击败经过训练的 CNN。
  3. 该系统可以胜过传统的深度神经网络并检测对抗样本。

0x03 系统模型

攻击生成系统和对抗性RL系统。

攻击生成系统:对练好的CNN生成对抗样本。

对抗性RL系统:为了避免训练结果相同,采用不同的训练算法。攻击生成agent在前期已经用DQN训练完成,能够日穿CNN;防御agent会给样本打分,使用DDPG训练。这样的话,攻击者放出来一个样本,防御者会进行判别。

一些想法:其实还是要正常和异常样本混着放,要不defense如果学会无脑判负的话就不好玩了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

PenguinLeee

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值