KDD99CupDataSet-SVM
clean data ,feature selection , svm based kdd99
数据清洗
数据集来源:KDD99入侵检测数据集 http://kdd.ics.uci.edu/databases/kddcup99/kddcup99.html
- 筛选出发生在TCP层的Dos流量和normal流量
get_train_data.py
其中Dos流量的标签'back.', 'land.', 'neptune.','smurf.', 'teardrop.', 'pod.'
normal流量的标签'normal.'
生成文件dos.kddcup.data.corrected.csv
最后标签类别如下
normal -> 1 attack -> -1
normal | attack |
---|---|
768670 | 1074241 |
* 通过统计特征进行数据筛选 wrap_up.py
- 随机森林对特征重要性进行排序