Discovering Exfiltration Paths Using Reinforcement Learning with Attack Graphs(2022)

文章提出了一种RL方法,通过攻击图在动态网络结构中寻找最优的渗透路径。利用MDP构建攻击图,RL代理模型分为演员和评论家,用于扫描网络和执行渗透测试。实验评估展示了不同风险策略下发现的渗透路径,为网络风险管理提供定量工具。
摘要由CSDN通过智能技术生成

Discovering Exfiltration Paths Using Reinforcement Learning with Attack Graphs(2022)

一、介绍

文章提出了一种在攻击图中发现渗透路径的RL方法,在攻击图的动态模型中对基于服务的防御性网络结构进行建模,发现最优的N条攻击路径。

二、RL

RL通过与环境交互来学习,描述了一组近似动态规划的求解方法,环境通常通过MDP建模,被定义为一个五元组{状态,动作,状态-动作对,概率转移函数,期望的奖励函数}。

目前主要的两种RL方式:

  • 基于值:他们试图找到或近似最佳值函数,这是一个动作和一个值之间的映射。 值越高,动作越好。 最著名的算法是Q学习及其所有增强的方法, 例如Deep Q Networks,Double Dueling Q Networks等。
  • 基于策略的:基于策略的算法(例如“ 策略梯度” 和REINFORCE)尝试直接找到最佳策略,而无需Q值作为中间步骤。

当这两个算法流行以后,下一个显而易见的步骤是……尝试合并它们。 这就是演员——评论家的诞生方式。 演员评论家旨在利用基于价值和基于策略的优点,同时消除其弊端。

主要思想是将模型分为两部分:一个用于基于状态计算动作,另一个用于估计动作的Q值。

参与者演员可以是类似于神经网络的函数逼近器,其任务是针对给定状态产生最佳动作。 当然,它可以是全连接的神经网络,也可以是卷积或其他任何东西。 评论家是另一个函数逼近器,它接收参与者输入的环境和动作作为输入,将它们连接起来并输出评分值(Q值)。

Q值实际上可以分解为两部分:

《使用IBM SPSS统计的统计学发现》(Discovering Statistics Using IBM SPSS Statistics)是一本介绍如何使用IBM SPSS统计软件进行统计分析的教材。该书由英国著名心理学家Andy Field编写,旨在帮助读者理解统计学的基本概念和方法,并通过实际案例和SPSS软件的应用来加深对统计数据分析的理解。 这本教材包含详细的步骤和说明,以指导读者在SPSS软件上进行各种统计分析。它涵盖了广泛的统计技术和方法,包括描述统计、推论统计、相关分析、因子分析、回归分析、多变量分析、非参数统计等。同时,它还包括对统计论文的写作和解读、数据处理和可视化等方面的介绍。 《使用IBM SPSS统计的统计学发现》以其易读、幽默的风格而受到广大读者的喜爱。作者通过幽默的插图和实际生活中的例子,将统计学理论与实践相结合,使复杂的统计概念更易理解。此外,该书也提供了大量的练习题和案例研究,以帮助读者巩固所学知识和提升数据分析的技能。 总之,对于需要使用IBM SPSS进行统计分析的人来说,《使用IBM SPSS统计的统计学发现》是一本非常有价值的教材。它不仅深入浅出地介绍了统计学理论和方法,还详细指导了如何在SPSS软件上进行各种统计分析。无论是学生、研究人员还是从事市场调研、数据分析等工作的人员,都能从中受益良多。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值