导读
网络和社交流量分析是检测和防御网络攻击的基础。随着数据集的日益剧增,手工定义规则的传统方法逐渐被机器学习(ML)方法替代,这是因为ML有更好的工作性能。在数据驱动的研究背景下,通过研究社交流量和网络流量的大量文献,本文采用相似相关性以及可提取特征等常用概念和共享网络安全目标的方法来分类网络主机与应用程序的网络流量和用户与Tweet的社交流量。因为网络和社交流量的研究不是孤立的,而是需要广泛使用大量的、不同的网络或社交流量数据,而且这些流量还具有许多特征,比如特定的大小,源与目的间的多层信息。本文阐述了一种新的基于数据驱动的网络安全研究方法(DDCS),并介绍其在社交和网络流量分析中的应用。DDCS的框架包括三个组成部分,即:网络安全数据处理、网络安全特征工程和网络安全建模。
概述
在互联网时代,网络安全问题尤为重要。而网络流量分析又是网络安全的重要组成部分,本文展示了一种基于数据驱动的流量分析模式。
大量文献都基于数据驱动,以前的数据分析只是传统的统计分析的工作。但在大数据和人工智能时代,即使数据复杂多样,许多隐藏的信息、知识等仍然可以通过ML来获得,可以用于解决当前和未来的网络安全挑战。网络和社交流量、统计特征和有效载荷都可以作为数据。
最近有关流量的研究综述,侧重于分析ML技术的应用。但是网络流量分析缺乏统一的数据驱动框架。这篇论文就填补了这一空白,提出了一种新的基于数据驱动的网络安全研究方法(DDCS),它包括网络安全数据处理、网络安全特征工程和网络安全建模三个方面。这三个方面是按顺序排列的,该框架有助于解决网络安全的核心问题。
基于数据驱动的网