2017机器学习Python异常检测CICIDS2017数据集
数据集简介
本仓库提供了一个名为“完整2017机器学习Python异常检测的CICIDS2017数据集”的资源文件。该数据集包含了良性和最新的常见攻击,与真实的现实世界数据(PCAPs)相类似。数据集还包括使用CICFlowMeter进行网络流量分析的结果,并根据时间戳、源和目的IP、源和目的端口、协议和攻击来标记流量(CSV文件)。此外,还提供了提取的特征定义。
数据集特点
- 真实背景流量:生成真实的背景流量是建立此数据集的首要任务。我们使用了B-Profile系统(Sharafaldin et al. 2016)来描述人类互动的抽象行为并生成自然的良性背景流量。
- 多协议支持:数据集基于HTTP、HTTPS、FTP、SSH和电子邮件协议,涵盖了25个用户的抽象行为。
- 详细标记:流量数据根据时间戳、源和目的IP、源和目的端口、协议和攻击类型进行了详细标记。
数据文件列表
Friday-WorkingHours-Afternoon-DDos.pcap_ISCX.csv
:2023-02-28,73.55MBWednesday-workingHours.pcap_ISCX.csv
:2023-02-28,214.74MBFriday-WorkingHours-Afternoon-PortScan.pcap_ISCX.csv
:2023-02-28,73.34MBFriday-WorkingHours-Morning.pcap_ISCX.csv
:2023-02-28,73.34MB
使用说明
- 下载数据集:请从本仓库下载所需的数据文件。
- 数据预处理:根据需要对数据进行预处理,如数据清洗、特征提取等。
- 模型训练:使用Python或其他机器学习工具进行模型训练,以实现异常检测。
- 结果分析:对模型训练结果进行分析,评估模型的性能。
注意事项
- 数据集较大,建议在具备足够存储空间的设备上进行处理。
- 数据集包含敏感信息,请确保在合法合规的范围内使用。
参考文献
- Sharafaldin, I., Lashkari, A. H., & Ghorbani, A. A. (2016). Toward Generating a New Intrusion Detection Dataset and Intrusion Traffic Characterization. In Proceedings of the 4th International Conference on Information Systems Security and Privacy (ICISSP).
希望本数据集能够帮助您在机器学习异常检测领域取得进展!