1.基本情况介绍
最近在做一个项目,也可以说是在写paper使用到了DARPA2000的数据集,首先这个数据集里面包括了网络数据包数据和日志文件。首先我们需要明白网络数据包数据和日志文件收集方式的不同。
2.收集数据的网络结构
官网给出来DARPA98的网络结构图如下:
从图中我们可以看到嗅探数据和审计数据分别是从Sparc1和inside server收集的,DARPA2000数据未给出明确的网络分布图,所以我们可以参考98数据集进行理解。
3.数据介绍
在官网https://archive.ll.mit.edu/ideval/data/2000data.html下载了DARPA2000数据集解压后,文件夹中的数据如下图:
3.1审计日志
审计日志(BSM)是基于主机的,记录了主机运行的很多信息,此处的审计文件打开后,你可能不太理解里面的含义,你需要移步网站https://docs.oracle.com/cd/E19455-01/806-1789/6jb25l4bv/index.html去对每个令牌的具体含义进行对照从而了解每个令牌中的各个字段是什么意思,这个网站写得很详细此处我就不过多的赘述。(红色框代表一条记录,绿色代表一个令牌