KDD99CupDataSet-SVM

这篇博客介绍了如何使用SVM对KDD99Cup数据集进行处理,包括数据清洗、特征选择和5折交叉验证。作者首先从KDD99入侵检测数据集中筛选出TCP层的Dos流量和正常流量,将标签分别设为1和-1。接着,通过统计特征和随机森林确定了特征的重要性。最后,提供了交叉验证的代码实现。
摘要由CSDN通过智能技术生成

KDD99CupDataSet-SVM

clean data ,feature selection , svm based kdd99

数据清洗

数据集来源:KDD99入侵检测数据集 http://kdd.ics.uci.edu/databases/kddcup99/kddcup99.html

  • 筛选出发生在TCP层的Dos流量和normal流量 get_train_data.py
    其中Dos流量的标签'back.', 'land.', 'neptune.','smurf.', 'teardrop.', 'pod.'
    normal流量的标签'normal.'
    生成文件dos.kddcup.data.corrected.csv
    最后标签类别如下
    normal -> 1 attack -> -1
normal attack
768670 1074241

* 通过统计特征进行数据筛选 wrap_up.py

  • 随机森林对特征重要性进行排序

                
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值