已处理数据集下载:KDD_CUP99.zip - 蓝奏云
数据处理和性能测试代码下载:intrusion-detection-system-accuracy-99-9.zip - 蓝奏云
必看说明:raw文件夹是源文件,processed文件夹是处理后的数据,csv表格中的最后四列是都是标签的意思。target是23分类的文字标签,target-digit是23分类的数字化后的标签,如果做的任务是23分类,直接用这个就好,帮你省去了target编码的步骤。attack_type是5分类(即大类)的文字标签,attack_type_digit是5分类的数字化后的标签,如果任务是5分类,直接用这个就好了,帮你省去attack_type_digit编码的步骤。
下图是用随机森林和svm模型的分类结果:,都在99.9%左右