毕设用到KDD CUP99数据集,在处理时花费了一些功夫,现想把自己做的方法和结果分享一下。
数据集下载地址:http://kdd.ics.uci.edu/databases/kddcup99/kddcup99.html
下面这个博客讲的很细致,数据集介绍还有Python预处理都很明白,可以参考。
https://blog.csdn.net/asialee_bird/article/details/80491256
介于自己使用的是matlab做的实验,主要是字符特征数字化的处理有些不同。
方法:借助navicat软件,将原数据信息存储成数据库表,软件中直接编写SQL语句转化,将结果转存成新的txt文件(或者其他形式)使用。
结果已上传,可以自行下载使用:https://download.csdn.net/download/weixin_45862742/12507398
归一化和标准化在matlab中有自带的函数,可以直接调用。