网络流量数据集(PCAP)

本文汇总了多个全球知名机构提供的网络流量数据集,包括MAWI、CIC、KDD'99、CAIDA等,涵盖了教育、研究、安全等多个领域,可用于分析、检测和防御网络攻击。
摘要由CSDN通过智能技术生成

汇总

https://www.test404.com/post-1494.html

 

部分转自https://blog.csdn.net/answer3lin/article/details/86480662

MAWI Working Group Traffic Archive
URL:http://mawi.wide.ad.jp/mawi/

CIC dataset
Canadian Institute for Cybersecurity datasets are used around the world by universities, private industry and independent researchers.

URL:https://www.unb.ca/cic/datasets/

KDD’99 (University of California, Irvine 1998, 99)
CAIDA (Center of Applied Internet Data Analysis – 2002/2016)
http://www.caida.org/data(缺乏政府,企业和研究机构的支持,DatCat发展空间不大)

UNIBS
数据集www.ing.unibs.it/ntw/tools/traces/index.php

WIDE
数据集http://mawi.wide.ad.jp/mawi

WITS
数据集www.wand.net.nz/wits(只能通过IPV6主机访问)

MAWILab
http://www.fukuda-lab.org/mawilab/data.html

CIDDS data sets
https://www.hs-coburg.de/index.php?id

CICIDS2017数据集是一个网络入侵检测数据集,包含了来自真实网络环境的大量网络流量数据。该数据集包含了不同类型的攻击,例如DoS、DDoS、PortScan、Botnet等,并且还包含了正常的网络流量数据。这个数据集可以用于网络入侵检测算法的研究和评估。如果你想了解更多关于CICIDS2017数据集的信息,可以参考引用中提供的链接。 以下是一些使用CICIDS2017数据集进行机器学习算法训练和测试的例子: 1.使用随机森林算法进行网络入侵检测 ```python from sklearn.ensemble import RandomForestClassifier from sklearn.model_selection import train_test_split import pandas as pd # 读取数据集 data = pd.read_csv('Friday-WorkingHours-Afternoon-DDos.pcap_ISCX.csv') # 数据预处理 data = data.dropna() data = data.drop(['Flow ID', 'Src IP', 'Dst IP', 'Timestamp'], axis=1) data['Label'] = data['Label'].apply(lambda x: 1 if 'BENIGN' in x else 0) # 划分训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(data.drop('Label', axis=1), data['Label'], test_size=0.2) # 训练模型 rf = RandomForestClassifier(n_estimators=100) rf.fit(X_train, y_train) # 测试模型 print('Accuracy:', rf.score(X_test, y_test)) ``` 2.使用支持向量机算法进行网络入侵检测 ```python from sklearn.svm import SVC from sklearn.model_selection import train_test_split import pandas as pd # 读取数据集 data = pd.read_csv('Friday-WorkingHours-Afternoon-DDos.pcap_ISCX.csv') # 数据预处理 data = data.dropna() data = data.drop(['Flow ID', 'Src IP', 'Dst IP', 'Timestamp'], axis=1) data['Label'] = data['Label'].apply(lambda x: 1 if 'BENIGN' in x else 0) # 划分训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(data.drop('Label', axis=1), data['Label'], test_size=0.2) # 训练模型 svm = SVC(kernel='linear') svm.fit(X_train, y_train) # 测试模型 print('Accuracy:', svm.score(X_test, y_test)) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值