学习笔记（二）：使用K近邻算法检测Web异常操作

最新推荐文章于 2022-04-25 14:27:27 发布

林咚咚

最新推荐文章于 2022-04-25 14:27:27 发布

阅读量588

点赞数 1

分类专栏： web安全算法 python

本文链接：https://blog.csdn.net/weixin_39878297/article/details/83042181

版权

python 同时被 3 个专栏收录

21 篇文章 1 订阅

订阅专栏

web安全

14 篇文章 3 订阅

订阅专栏

算法

13 篇文章 1 订阅

订阅专栏

使用全量比较，而不是最频繁和最不频繁的比较。

1.数据搜集

我们使用词集的模型，将全部命令去重后形成一个大型向量空间，每个命令代表一个特征，首先通过遍历全部命令，生成对应词集。

with open(filename) as f:
for line in f:
    line = line.strip('\n')
    dist.append(line)
fdist = FreqDist(dist).key()

2.特征化

使用词集将操作命令向量化。

def get_user_cmd_feature_new(user_cmd_list,dist):
    user_cmd_feature=[]
    for cmd_list in user_cmd_list:
        v=[0]*len(dist)
        for i in range(0,len(dist)):
            if dist[i] in cmd_list:
                v[i] += 1
          user_cmd_feature.append(v)
return user_cmd_featrue

3.训练模型

user_cmd_list,dist = load_user_cmd_new("..")
user_cmd_featrue = get_user_cmd_feature_new(user_cmd_list,dist)

labels = get_label("...",2)
y = [0]*50+labels
neigh =KneightborsClassifier(n_neighbors = 3)

4.效果验证

使用交叉验证，10次取样和验证，提高验证可信度。

cross_validation.cross_val_score(neight, user_cmd_feature, y, n_jobs=-1, cv=10)

准确率达到93%

林咚咚

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
3
评论
学习笔记（二）：使用K近邻算法检测Web异常操作

使用全量比较，而不是最频繁和最不频繁的比较。1.数据搜集我们使用词集的模型，将全部命令去重后形成一个大型向量空间，每个命令代表一个特征，首先通过遍历全部命令，生成对应词集。with open(filename) as f:for line in f: line = line.strip('\n') dist.append(line)fdist = F...
复制链接

扫一扫