学习笔记（十五）：RNN识别WebShell

最新推荐文章于 2024-05-29 13:34:37 发布

林咚咚

最新推荐文章于 2024-05-29 13:34:37 发布

阅读量659

点赞数

分类专栏： python web安全

本文链接：https://blog.csdn.net/weixin_39878297/article/details/84229949

版权

这篇学习笔记探讨了如何使用RNN（循环神经网络）来识别WebShell。通过ADFA-LD数据集，记录系统调用序号，将正常序列标记为0，WebShell序列标记为1进行训练。然而，实验结果显示模型的准确率仅为87%，验证效果不理想。

摘要由CSDN通过智能技术生成

1.使用ADFA-LD数据集，逐行读取，并记录系统调用序号的最大值。

max_sequences_len=300
max_sys_call=0

def load_one_flle(filename):
    global max_sys_call
    x=[]
    with open(filename) as f:
        line=f.readline()
        line=line.strip('\n')
        line=line.split(' ')
        for v in line:
            if len(v) > 0:
                x.append(int(v))
                if int(v) > max_sys_call:
                    max_sys_call=int(v)
    return x

加载正常系统调用序列，并标记为0

def load_adfa_training_files(rootdir):
    x=[]
    y=[]
    list = os.listdir(rootdir)
    for i in range(0, len(list)):
        path = os.path.join(rootdir, list[i])
        if os.path.isfile(path):
            x.append(load_one_flle(path))
            y.append(0)
    return x,y

加载WebShell运行下的系统调用序列，并标记为1