我爱读文献 |
review of machine learning techniques for network traffic classification
Sharma N, Arora B. Review of Machine Learning Techniques for Network Traffic Classification[J]. Available at SSRN 3747605, 2020.
传统的网络流量分类 可以分为四种类型 :基于端口的,基于载荷的,统计的以及行为的
对于基于端口的方式(对包头进行检查)来说主要有以下两种缺点:
- 某些应用程序可以将自身设置为知名端口来混淆自己
- 由于当前应用程序的多态性,通常无法理解确切的端口号
对于基于载荷的分类方式(不局限于对报头进行检查,而且与载荷内容进行对比)有以下两种缺陷:
- 当出现大量加密流量未分类的情况时,增加了误报率
- 检查有效载荷内容违反了用户隐私策略,计算成本增加
对于基于统计特性(对于包长度、流持续时间、包间隔等统计属性区分是否为正常流量)其问题为不能满足实时流量增长的要求
对于基于行为分析的方式(通过分析终端或者目标主机接受到的网络流量模式来检查整个网络流量【通过检查主机数量和端口数量来识别特定的应用程序】)来说这种方法只考虑到了终端或者是客户端的行