简介
ISCXTor2016数据集是UNB(University of New Brunswick)发布的Tor流量有标签数据集。这个大学发布了很多网络安全领域的数据集,包括广泛使用的NSL-KDD数据集和CICIDS2017数据集。本文对该数据集进行尽可能详细的介绍。
数据集生成
为了生成现实世界流量的代表性数据集,作者定义了一组任务,以确保数据集具有足够的多样性和条目数。作者为用户Alice和Bob创建了帐户,以便使用Skype,Facebook等服务。数据集包含来自超过18种代表性应用程序(例如,facebook,skype,spotify,gmail等)的以下8种类型的流量(browsing, chat, audio-streaming, video-streaming, mail, VOIP, P2P 和 File Transfer)。
Tor流量捕获场景如图1所示。图出自参考文献中的论文。
工作站通过网关虚拟机连接到Internet,后者又通过Tor网络路由所有流量。通过此配置,在工作站虚拟机上使用Tor网络变得透明。作者同时捕获了工作站和网关处的传出流量,并收集了两个.pcap文件:一个常规流量(工作站)pcap文件和一个Tor流量ÿ