僵尸网络检测数据集CTU-13介绍及使用

首先感谢爱学习的大白菜爱学习的大白菜的博客_CSDN博客-刷题,ACM之路,机器学习领域博主对CTU-13数据集的描述的翻译,这使得后面对这份数据集的理解更加容易。

参考CTU-13数据集_爱学习的大白菜的博客-CSDN博客

由于要做僵尸网络检测的工作,但是没有相关数据,需要搜集相关数据集进行算法的验证,通过调研,发现CTU-13数据集开源,且进行了处理分析,减少了数据处理的一些工作,比如对流数据进行了聚合,生成双向流数据文件,也就是后面要用到的文件。

通过查看CTU-13数据集网站和上述博客的分享,了解了数据集的大致情况,但是需要下载数据集时,犯难了,每个数据集下包含多种数据类型多个文件,哪个是我可以用于僵尸网络检测的有标签的数据集,这里先给出答案:

detailed-bidirectional-flow-labels/

 文件夹下的以.binetflow为后缀的文件,如下

 但是发现直接点击这个文件,不能下载,只能查看里面的数据内容

 如何获取这些数据到文件,可以用下面的方法:

scenario_1 = pd.read_csv('https://mcfp.felk.cvut.cz/publicDatasets/CTU-Malware-Capture-Botnet-42/detailed-bidirectional-flow-labels/capture20110810.binetflow')

这个语句直接到相应的网址去下载数据,并且是dataframe格式化的,很好,这就是我想要的。

接下来如果会重复用到该数据,可以使用

scenario_1.to_csv('scenario_1.csv', header = True, index = False)

将数据保存在本地

在这份数据中的label标注了流的类型,如下

 scenario_1是第一个僵尸网络场景的数据,数据量和数据集描述中一致

具体的也可以看下不同类型数据的占比。

对于每个场景,数据集中会告知被感染的僵尸主机IP。

 

 

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
这个问题是关于MySQL服务器的错误信息。根据提供的引用内容,无法确定具体的原因。但是,根据常见的错误信息,这个错误可能是由于MySQL服务器无法更新PID文件导致的。PID文件是用来存储MySQL服务器进程ID的文件,如果服务器无法更新该文件,可能是由于权限问题或者其他系统配置问题引起的。为了解决这个问题,可以尝试以下几个步骤: 1. 检查MySQL服务器的日志文件,查看是否有其他错误或警告信息,以便更好地理解问题的根本原因。 2. 确保MySQL服务器的数据目录(/usr/local/mysql/data)具有正确的权限设置,MySQL服务器需要有足够的权限来读取和写入该目录。 3. 检查系统的磁盘空间,确保磁盘没有满,否则可能导致无法写入PID文件。 4. 如果问题仍然存在,可以尝试重新启动MySQL服务器,并监视日志文件以获取更多的错误信息。 请注意,这只是一些可能的解决方法,具体的解决方法可能因系统配置和环境而异。建议在解决问题之前备份重要的数据,并在进行任何更改之前仔细阅读相关文档或咨询专业人士。 #### 引用[.reference_title] - *1* *2* *3* [centos7安装大数据平台](https://blog.csdn.net/zhaoyaxiong_ctu/article/details/113151938)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值