我正在使用ADFA-
LD数据集进行基于主机的入侵检测项目,现在正在进行特征提取模块。我构建了由长度为4的系统调用短语组成的短语词典。现在,为了进行特征提取,我需要将这些短语与新的系统调用轨迹进行比较(以下是一些示例):
。
我需要的是,如何将这些短语与新痕迹进行比较。我在用Java做。
我的短语字典:
sys_socketcall-sys_poll-sys_clock_gettime-sys_poll
sys_clock_gettime-sys_poll-sys_poll-sys_socketcall
sys_poll-sys_socketcall-sys_poll-sys_clock_gettime
sys_poll-sys_clock_gettime-sys_clock_gettime-sys_clock_gettime
sys_clock_gettime-sys_clock_gettime-sys_socketcall-sys_clock_gettime
sys_socketcall-sys_clock_gettime-sys_poll-sys_poll
sys_poll-sys_poll
我使用“-”作为分隔符,将这些短语与新轨迹进行比较,因此我以“-”加入了唯一的系统调用。